EP 0 786 519 A2 

TCTTTAAAAA CTTTTTCTTC TACTAATTTT AAATCTACAT ATGCGTTAGT CATTATTCCC 3 60 

CTCCTTTTCG TTTAATATAA TATTTAATTT ACTTAAAATG CTTTGTACAT AAGTG CTAAG 4 20 

TCTAACTTTT CGCCATACAT TTCTGGCTCA TAAGAGCGTA AGATTGTAAA ACCTTGCTCT 480 

TTATAGTAAG CTACTGCTTC TTCATTTTTA TTATCTACTT CTAAGTAAAC ACCTTCAAAT 54 0 

TTATCTTCAA AACGTGATAA TCCTTCATTT AACAATGCTG TACCATAACC TGTATGTTGC 6 00 

GATTCTGGTT TAACATAATG AGCTGATAAA TATAATTCTT CACCGTAAAT AAAGTTAGCA 66 0 

AAGCCAACGA TGTCATTACC TTCTTCAACG ACTAAGAATA ATTGTTCTTG AAGTCTTTTC 72 0 

TTTAAATGAT GTTCATTATA TGAAGCTtCT AACAAGTGAT TAACTGTTGT CGCAGCGTAT 78 0 

ATATTTAAGT ATGTATTAAA C CAAG CTTTA GTTGCGACAT CTCTAATTTG AACAACATCT 84 0 

TTTTCAGTTG CTTGTCTTAC CTTGAACATG ACTTTCTCCC CTTATTAACA AGTTTTAATA 90 0 

ACGGCATTAT ACCACAACTT GCTCAATACT TAATAAACAA TGATTGTCTA TT CAATTTAT 960 

ATATtTATAT TTTCCGTTAA AATTAAAAAT AAAAAATAAC GAAGCAAAAA AtCACTTCGT 102 0 

TTAGTATGAG GTATGTCTTA TTGCAATATA CTATTCCACT CAGTTGCACG TGCTAAGGCA 108 0 

TAGTTGTCTT TCATGATGTC AC CAGGCTTT TCAGCAGTTC CAATAATATA ACCATTTAAA 114 0 

GTGGCACCTA rAAAGTCTAA ACTATATTTC ATTTGCGTAA TTGCTGGTTC GCTTTTATTT 120 0 

TTGGACAATC TCCACCAACT AAAATAACTC TAAAATCCTT TTCGGCCATT TGTGCCTTAA 12 6 0 

AATTAGGATA TCGTTTATCT TGTAATGTTT CTGAC CAATG TTCGATAAAT GCTTTCAATG 1320 

GTGCTGAAAT GCTATACCAA TACACTGGTG ATGCAAAAAT AATTGTATCA CTAGCCAATA 13 8 0 

TTTTATCTAG AATCGGCAAA TAGTCATCGT CATATGAAGT AATAGTCTCT GCTGTATGTC 14 4 0 

TCACGTCACG TATCGGTTTA AACTGATGTT GTGTCACGTC AATC CATTG A TACTCTAAAT 15 00 

CTTGCAAAGC GAATTTTGTT AATTGTGCAG TATTACCGTT TGGTCTACTC CCACCAAACA 1560 

AAACAGTAAT CATTTTAGCC TAACCTCACT TTTGATTAAT AAATATCTGT GTTTTTCGTT 1620 

ACCTAATTAT ACTATCATAA GCTTTGCCTA CCGAATAGTA AAACGCTTAC AACTTTTATA 16 80 

TAAATTTGAC GAAATTTC GT CATGCCTTAT ATAACGTCGT TTGTGATACG GGGCTAATTC 174 0 

ATGATGAAAT TAGATACATA TATCACCATT AAATACAATT CATTTAGTCT TCAATCGGAA 1800 

ACAGTTCATC GATATATTGA ATCTCATCAT CTGATAAAAC GATATCTGCA GCTTTAATAT 1860 

TTTCAACGAC TTGTTCTGCA CGTTTTGCAC CAGGAATAAT CACATCGATA GCTGGTCTCG 192 0 

TTAAATAAAA TGCTAATACA ATGTTCGCAA TTGAAGTTTG ATGTGCTGCA GCTATGCTTT 1980 

CCAAAGCTTT TACGCGACGC ACATTTT CTT CAAATACACC TGGTTTAAAA TCACGACGTG 204 0 
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GCTAATGGGA AATATGGAAT AAATGTGATT TGGTGATCAA CACAATATTG TAATACTGCC 2160 

TCATTTTCGC GATGCAATAA ATTATATTCT AACTGTACAA CATCAACGTA ACCATCTTTA 22 20 

TTTGCTTCTT TAAGTTGATC TAATGTGAAA TTTGATACAC CAATTGCTTT AATCTTCCCT 2 2 80 

TGTTCCTTAA GCTCTTGTAA TGCTGCAACT GCTTGATCTT TCGGAGTGTT GTTATCCGGA 2 34 0 

AAATGAATAT AATATAAATC GATATAATCA GTTTGTAGAC GTTTCAAACT ATTCTCAACT 24 0 0 

TGTTGTTTTA AATATTCCGG TTGATTGTTC TGATGTACTT CTTGATTTTC ATCAAATTCA 24 6 0 

TGAGACCCTT TCGTAG CAAT TTTAATTTGC TCTCGCGGAT ATTCTTTAAC AACTTCTCCA 252 0 

ACCAATTCTT CTGATCGTTC TGGCCCATAA ATATATGCCG TATCTAATAA ATTAATACCA 2580 

TGATTAATGG CTTGACGAAC AACATCTTTT CCTTGTTCTT CATCTAAGTT CGGATATAAA 264 0 

TTATGCCCAa CCTAtGCGTT CGTCCCAAGT GCGATTGGAA ACACTTCAAC ATCAGATTTA 2700 

CCTAAG TTTA CAAATTGCTn CATTAGACCC AGCnCCTT 2 73 8 
(2) INFORMATION FOR SEQ ID NO: 87: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9425 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 87: 

GATTAGATGA TATTTAACGA AAATTAaGrT GmAATACTtG AATGTArGAa GTCTGATGTC 60 

GAAAATAGCT ATTAAAATAG AGTAGACGTA ATGtAAATGA AAGCAC CTAA AATAGAAAAA 12 0 

TTTCAAAAAT AGCGTAATTA TTATAATAAA TAGACTGCCA ATAAAATGCA ATTTTTCACT 180 

TATAACATTC TTCAAAAAAT AATAGCAAAA TTATGTAAAA AATATCTTGT CATGGCAAGA 24 0 

TTGGCTGTGC TATAATCTAT CTTGTGCTTA AGAACGGCTC CTTGGTCAAG CGGTTAAGAC 300 

ACCGCCCTTT CACGGCGGTA ACACGGGTTC GAGTCCCGTA GGAGTCACCA TTTTTTAGGT 360 

CTCGTAGTGT AGCGGTTAAC ACGCCTGCCT GTCACGCAGG AGATCGCGGG TTCGATTCCC 4 20 

GTCGAGACCG TACAAATGCC TATCCAAGAG GATAGGCATT TTTTTGCGTT TAATATTATA 4 80 

TTAATAAAAG ATATATGGAC GAATGATAAT CATATTGATT TATCTGTTCG TCCATTTTCT 54 0 

TTAAAATGTA TGAACCTCAA GTAACTTAGT GGTTGGATAT GAAAGATAAA CGTAGACAAT 60 0 

AAAATCTTTA TTAGACGTAC AAACATATGC TACTGTCAAC ATATTT CTTC GTTGTGATAT 66 0 

GCCACCAGTC CTCCATAA CA TCAATTGTTA AAGTAACGAA TAACGAATAA TGATATTTAT 720 
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GACCTCATCA TTGTGTTAAA TATCATTGTC ACAATCCGCC GTGAGAAACT AATAAAAAAT 84 0 

AG TAATATAT AAGTTTATAT TGGAAAATAG AATTAATAGC TTATAAATGG TAAATTATAT 90 0 

AATAGGTTAC TATACGTTAT AAGACGGAAA ATGCGCACAA TAACAAAAAT AGTAAGCGAC 96 0 

ATCCTGTGAT TTTTTACACA AACATAAACG ATAAAGAACA AAAAATGATA AAATAATATT 1020 

AATGATTTAA GAAAAGAGGT TTATGCAAAT GGCTAGAAAA GTTGTTGTAG TTGATGATGA 10 80 

AAAACCGATT GCTGATATTT TAGAATTTAA CTTAAAAAAA GAAGGATACG ATGTGTACTG 114 0 

TGCATACGAT GGTAATGATG CAGTCGACTT AATTTATGAA GAAGAACCAG ACATCGTATT 12 00 

ACTAGATATC ATGTTAC CTG GTCGTGATGG TATGGAAGTA TGTCGTGAAG TGCGCAAAAA 1260 

ATACGAAATG CCAATAATAA TGCTTACTGC TAAAGATTCA GAAATTGATA AAGTGCTTGG 1320 

TTTAGAACTA GGTGCAGATG ACTATGTAAC GAAACCGTTT AGTACGCGTG AATTAATCGC 13 80 

ACGTGTGAAA GCGAACTTAC GTCGTCATTA CTCACAACCA GCACAAGACA CTGGAAATGT 144 0 

AACGAATGAA ATCACAATTA AAGATATTGT GATTTATCCA GACG CATATT CTATTAAAAA 1500 

ACGTGGCGAA GATATTGAAT TAACACATCG TGAATTTGAA TTGTTCCATT ATTTATCAAA 156 0 

ACATATGGGA CAAGTAATGA CACGTGAACA TTTATTACAA ACAGTATGGG GCTATGATTA 1620 

CTTTGGCGAT GTACGTACGG TCGATGTAAC GATTCGTCGT TTACGTGAAA AGATTGAAGA 1680 

TGATCCGTCA CATCCTGAAT ATATTGTGAC GCGTAGAGGC GTTGGATATT TCCTCCAACA 174 0 

ACATGAGTAG AGGTCGAAAC GAATGAAGTG GCTAAAACAA CTACAATCCC TTCATACTAA 1800 

ATTTGTAATT GTTTATGTAT TACTGATTAT CATTGGTATG CAAATTATCG GGTTATATTT 1860 

TACAAATAAC CTTGAAAAAG AG CTG CTTG A TAATTTTAAG AAGAATATTA CGCAGTACGC 192 0 

GAAACAATTA GAAATTAGTA TTGAAAAAGT ATATGACGAA AAGGGCTCCG TAAATGCACA 198 0 

AAAAGATATT CAAAATTTAT TAAGTGAGTA TGCCAACCGT CAAGAAATTG GAGAAATTCG 2 04 0 

TTTTATAGAT AAAGACCAAA TTATTATTGC GACGACGAAG CAGTCTAACC GTAGTCTAAT 2100 

CAATCAAAAA GCGAATGATA GTTCTGTCCA AAAAG CACTA TCACTAGGAC AATCAAACGA 2160 

TCATTTAATT TTAAAAGATT ATGGCGGTGG TAAGGACCGT GTCTGGGTAT ATAATATCCC 2 220 

AGTTAAAGTC GATAAAAAGG TAATTGGTAA TATTTATATC GAATCAAAAA TTAATGACGT 228 0 

TTATAAC CAA TTAAATAATA TAAATCAAAT ATTCATTGTT GGTACAGCTA TTTCATTATT 2 340 

AATg CACAGT CATCCTAGGA TTCTTTATAG CGCGAACGAT TACCAAACCA ATCACCGATA 24 0 0 

TGCGTAACCA GACGGTCGAA ATGTCCaGAG GTAACTATAC GCAACGTGTG AAGATTTATG 24 60 

GTAATGATGA AATTGGCGAA TTAGCTTTAG CATTTAATAA CTTGTCTAAA CGTGTACAAG 2 520 
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GTGATGGTAT TATTGCAACA GACCGCCGTG GACGTATTCG TATCGTCAAT GATATGGCAC 264 0 

TCAAGATGCT TGGTATGGCG AAAGAAGACA TCATCGGATA TTACATGTTA AGTGTATTAA 2700 

GTCTTGAAGA TGAATTTAAA CTGGAAGAAA TTCAAGAGAA TAATGATAGT TTCTTATTAG 276 0 

ATTTAAATGA AGAAGAAGGT CTAATCGCAC GTGTTAACTT TAGTACGATT GTGCAGGAAA 2 820 

CAGGATTTGT AACTGGTTAT ATCGCTGTGT TACATGACGT AACTGAACAA CAACAAGTTG 2 8 80 

AACGTGAGCG TCGTGAATTT GTTGCCAATG TATCACATGA GTTACGTACA CCTTTAACTT 294 0 

CTATGAATAG TTACATTGAA GCACTTGAAG AAGGTGCATG GAAAGATGAG GAACTTGCGC 30 00 

CACAATTTTT ATCTGTTACC CGTGAAGAAA CAGAACGAAT GATTCGACTG GTCAATGACT 306 0 

TGCTACAGTT ATCTAAAATG GATAATGAGT CTGATCAAAT CAACAAAGAA ATTATCGACT 312 0 

TTAACATGTT CATTAATAAA ATTATTAATC GACATGAAAT G TCTGCG AAA GATACAACAT 3180 

TTATTCGAGA TATTCCGAAA AAGACGATTT TCACAGAATT TGATCCTGAT AAAATGACGC 324 0 

AAGTATTTGA TAATGTCATT ACAAATGCGA TGAAATATTC TAGAGGCGAT AAACGTGTCG 33 00 

AGTTCCACGT GAAACAAAAT CCACTTTATA ATCGAATGAC GATTC GTATT AAAGATAATG 3 360 

GCATTGGTAT TCCTATCAAT AAAGTCGATA AGATATTCGA CCGATTCTAT CGTGTAGATA 342 0 

AGGCACGTAC GCGTAAAATG GGTGGTACTG GATTAGGACT AGCCATTTCG AAAGAGATTG 34 8 0 

TGGAAGCGCA CAATGGTCGT ATTTGGG CAA ACAGTGTAGA AGGTCAAGGT ACATCTATCT 3 54 0 

TTATCACACT TCCATGTGAA GTCATTGAAG ACGGTGATTG GGATGAATAA TAAGGAGCAT 3 6 00 

ATTAAATCTG TCATTTTAGC ACTACTCGTC TTGATGAGTG TCGTATTGAC ATATATGGTA 3 66 0 

TGGAACTTTT CTCCTGATAT TGCAAATGTC GACAATACAG ATAGTAAGAA GAGTGAAACG 3 720 

rAACCTTTAA CGACACCTAT GACAGCCAAA ATGGATACAA CTATTACGCC ATTTCAGATT 3780 

ATTCATTCGA AAAATGATCA TCCAGAAGGA ACGATTGCGA CGGTATCTAA TGTGAATAAA 384 0 

CTGACGAAAC CTTTGAAAAA TAAAGAAGTG AAGTCCGTGG AACATGTTCG TCGTGATCAT 3 900 

AACTTGATGA TTCCTGATTT GAACAGTGAT TTTATATTAT TCGATTTTAC GTATGATTTA 3 960 

CCGTTATCAA CATATCTTGG TCAAGTACTG AACATGAATG CGAAAGTACC AAATCATTTC 4 02 0 

AATTTCAATC GTTTGGTCAT AGATCATGAT GCTGATGATA ATATCGTGCT TTATGCTATA 4 08 0 

AG CAAAG AT C GC CACGATTA CGTAAAATTA ACAACTACAA CGAAAAATGA TCATTTTTTA 414 0 

GATGCATTAG CAGCAGTGAA AAAAGATATG CAACCATACA CAGATATCAT CACAAACAAA 4 20 0 

GATACAATTG ATCGTACGAC GCATGTTTTT GCACCAAGTA AACCTGAAAA GTTAAAAACA 42 6 0 

TATCGCATGG TATTTAACAC GATTAGTGTT GAGAAAATGA ATGCTATACT ATTTGACGAT 432 0 
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GCAAACTATA ACGATAAAAA TGAAAAATAT CATTATAAAA ACCTGTCCGA AGATGAAGCG 4 44 0 

AGTTCCAGCA AAATGGAAGA AACGATTCCA GGAACCTTTG ATTTTATTAA TGGTCATGGT 4 50 0 

5 GGTTTCTTAA ACGAAGACTT TAGATTGTTT AGTACGAATA ATCAGTCAGG CGAGTTAACA 4 56 0 

TATC aACGTT TCCtTAATGG TTATCCAACG TTTAATAAAG AAGGTTCTAA TCAAATTCAA 46 20 

GTCACTTGGG GTGAAAAAGG CGTCTTTGAC TATCGTCGTT CGTTATTACG CACCGACGTT 4 6 80 

w 

GTTTTAAATA GTGAGGATAA TAAATCGTTG CCGAAATTAG AGTCTGTACG TTCAAGCTTA 4 74 0 

GCGAACAATA GTGATATTAA TTTTGAAAAA GTAACAAACA TCGCTATCGG TTACGAAATG 4 8 00 

CAGGATAATT CAGATCATAA TCACATTGAA GTGCAGATTA ACAGTGAACT CGTACCGCGT 4 86 0 

15 

TGGTATGTAG AATATGATGG CGAATGGTAT GTTTATAACG ATGGGaGGCT TGaATAAATG 4 920 

AACTGGaAAC TGACAAAGAC ACTTTTCATT TTCGTGTTTA TTCTTGTCAA CATCGTGTTA 4 980 

2Q GTATCGATTT ATGTTAATAA AGTCAATCGC TCACACATTA ATGAAGTCGA GAGTAACAAT 5 04 0 

GAAGTTAATT TTCAGCAAGA AGAAATTAAA GTACCGACTA GTATATTGAA TAAATCAGTT 510 0 

AAAGGTATAA AATTAG AG CA AATTACAGGG CGATCAAAAG ACTTTAGTTC TAAAGCTAAA 516 0 

25 GGCGATTCGG ATTTGACCAC ATCAGATGGT GGAAAATTAT TGAATGCGAA CATTAGTCAA 522 0 

TCGGTAAAGG TCAGTGACAA TAACTTAAAA GATTTGAAAG ATTATGTTAA CAAGCGCGTA 52 8 0 

TTTAAAGGTG CTGAATATCA ATTAAGCGAG ATTAGTTCAG ATTCTGTAAA ATATGAACAA 5 34 0 

30 ACGTATGATG ATTTTCCGAT TTTAAATAAC AGTAAAGCGA TGTTAAACTT TAATATAGAA 54 0 0 

GATAACAAAG CGACTAGTTA TAAACAATCA ATGATGGATG ACATTAAGCC CACAGATGGT 54 6 0 

GCAGATAAGA AGCATCAAGT GATTGGTGTG AGAAAAGCAA TCGAGGCATT ATATTATAAT 5 52 0 

35 

CGTTACTTGA AAAAAGGTGA TGAAGTCATT AATGCTAGAC TCGGTTACTA CTCAGTCGTG 5580 

AATGAAACGA ATGTTCAATT GTTACAACCA AACTGGGAAA TTAAAGTGAA GCATGACGGT 564 0 

AAGGATAAAA CGAATACTTA CTATG TCGAA GCGACAAATA ATAAC CCTAA AATTATTAAT 570 0 

40 

CATTAATATG AATCGTAATA AGCTAGCATT GCAAGCTCAT CATATGTGAG AAGCGGTGCT 576 0 

AGCTTTTTTG q^qq^qqq-j; TTATTATGGC TGATGTTTTT GCGTCTCCAA CGTGCGCATT 582 0 

45 TATTCATATT TTAAGTAGAA CCG CATTGTA AAATTAGTGT AACTGTTATT TTAAAAACTT 5 88 0 

TAGTATTTGT CTAATCATTG TTATAATAAT TAAGAAATTC ATTGCACGTG ATTATCAAAA 5 94 0 

TTTAAATATA AGAAACCGGT CGATGAACTA AAGTTACATA ATAGGAAAGG TATACAAAAC 60 00 

50 AGCTAATATA CTGATAGTTT CTGTAGGGAA AATCGTATAT TTGCACTGAT GTATATTGCA 60 60 

GTCATATAGA GAGATTGACT GTTTAAAGAG AAAGGATGAG CCGCTTGATA CGCATGAGTG 612 0 

55 



554 



EP 0 786 519 A2 



TAGTTGATGT TGGTTTGACT GGAAAGAAAA TGGAAGAATT GTTTAGTCAA ATTGACCGTA 624 0 

ATATTCAAGA TTTAAATGGT ATTTTAGTAA CCCATGAACA TATTGATCAT ATTAAAGGAT 63 0 0 

TAGGTGTTTT GGCGCGTAAA TATCAATTGC CAATTTATGC GAATGAAAAA ACTTGGCAGG 6 360 

CAATTGAAAA GAAAGATAGT CGCATCCCTA TGGATCAGAA ATTCATTTTT AATCCTTATG 6420 

AAACAAAATC TATTGCAGGT TTCGATGTTG AATCGTTTAA CGTGTCACAT GATGCAATAG 64 80 

ATCCGCAATT TTATATTTTC CATAATAACT ATAAGAAGTT TACGATTTTA ACGGATACGG 6 540 

GTTACGTGTC TGATCGTATG AAAGGTATGA TACGTGGCAG CGATGCGTTT ATTTTTGAGA 6 600 

GTAAT CATGA CGTCGATATG TTGAGAATGT GTCGTTATCC ATGGAAGACG AAACAACGTA 6660 

TTTTAGGCGA TATGGGTCAT GTATCTAATG AGGATGCGGC TCATGCAATG ACAGACGTGA 6 720 

TTACAGGTAA CACGAAACGT ATTTACCTAT CGCATTTATC ACAAGACAAT AACATGAAAG 6 7 80 

ATTTGGCGCG TATGAGTGTT GGCCAAGTAT TGAACGAACA CGATATTGAT ACGGAAAAAG 6 840 

AAGTATTGCT ATGTGATACG GATAAAGCTA TTCCAACGCC AATATATACA ATATAAATGA 6900 

GAGTCATCCG ATAAAGTTCC GCATTGCTGT GAGACGACTT TATCGGGTGC TTTTTTATGT 6 960 

TGTTGGTGGG AAATGGCTGT TGTTGAGTTG AATCGGCTTG ATTGAAATGT GTAAAATAAT 7 020 

TCGATATTAA ATGTAATTTA TAAATAATTT ACATAAAATC AATCATTTTA ATATAAGGAT 7 0 80 

TATGATAATA TATTGGTGTA TGACAGTTAA TGGAGGGAAC GAAATGAAAG CTTTATTACT 7140 

TAAAACAAGT GTATGGCTCG TTTTGCTTTT TAGTGTAATG GGATTATGGC AAGTCTCGAA 7200 

CGCGGCTGAG CAGCATACAC CAATGAAAGC ACATGCAGTA ACAACGATAG ACAAAGCAAC 726 0 

AACAGATAAG CAACAAGTAC CGCCAACAAA GGAAGCGGCT CATCATTCTG GCAAAGAAGC 7 3 20 

GGCAACCAAC GTATCAGCAT CAGCGCAGGG AACAGCTGAT GATACAAACA GCAAAGTAAC 73 8 0 

ATCGAACGCA CCATCTAACA AACCATCTAC AGTAGTTTCA ACAAAAGTAA ACGAAACACG 74 4 0 

CGACGTAGAT ACACAACAAG CCTCAACACA AAAACCAACT CACACAGCAA CGTTCAAATT 7500 

ATCAAATGCT AAAACAGCAT CACTTTCACC ACGAATGTTT GCTGCTAATG CACCACAAAC 7560 

AACAACACAT AAAATATTAC ATACAAATGA TATCCATGGC CGACTAGCCG AAGAAAAAGG 7 620 

GCGTGTCATC GGTATGGCTA AATTAAAAAC AGTAAAAGAA CAAGAAAAGC CTGATTTAAT 768 0 

GTTAG AC GCA GGAGACGCCT TCCAAGGTTT ACCACTTTCA AACCAGTCTA AAGGTGAAGA 774 0 

AATGGCTAAA GCAATGAATG CAGTAGGTTA TGATGCTATG GCAGTCGGTA ACCATGAATT 7 800 

TGACTTTGGA TAC GATCAGT TGAAAAAGTT AGAGGGTATG TTAGACTTCC CGATGCTAAG 7 860 

TAcTAACGTT TATAAAGATG GAAAACGCGC GTTTAAGCCT TCAACGATTG TAACAAAAAA 7 920 
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TGAAGGCATT AAAGGCGTTG AATTTAGAGA TCCATTACAA AGTGTGACAG CGGAAATGAT 8 04 0 

GCGTATTTAT AAAGACGTAG ATACATTTGT TGTTATATCA CATTTAGGAA TTGATC CTTC 8100 

5 AACACAAGAA ACATGGCGTG GTGATTACTT AG TG AAA CAA TTAAGTCAAA ATCCACAATT B16 0 

GAAGAAACGT ATTACAGTTA TTGATGG TCA TTCACATACA GTACTTCAAA ATGGTCAAAT 82 2 0 

TTATAACAAT GATGCATTGG CACAAACAGG TACAGCACTT GCGAATATCG GTAAGATTAC 828 0 

ATTTAATTAT CGCAATGGAG AGGTATCGAA TATTAAACCG TCATTGATTA ATGTTAAAGA 83 4 0 

CGTTGAAAAT GTAACACCGA ACAAAGCATT AGCTGAACAA ATTAATCAAG CTGATCAAAC 84 00 

ATTTAGAGCA CAAACTGCAG AGGTAATTAT TCCAAACAAT ACCATTGATT TCAAAGGAGA 84 60 

75 

AAGAGATGAC GTTAGAACGC GTGAAACAAA TTTAGGAAAC GCGATTGCAG ATGCTATGGA 8520 

AGCGTATGGC GTTAAGAATT TCTCTAAAAA GACTGACTTT GCCGTGACAA ATGGTGGAGG 8580 

20 TATTCGTGCC TCTATCGCAA AAGGTAAGGT GACACGCTAT GATTTAATCT CAGTATTACC 864 0 

ATTTGGAAAT ACGATTG CG C AAATTGATGT AAAAGGTTCA GACGTCTGGA CGGCTTTCGA 870 0 

ACATAGTTTA GGCGCACCAA CAACACAAAA GGACGGTAAG ACAGTGTTAA CAGCGAATGG 876 0 

25 CGGTTTACTA CATATCTCTG ATTCAATCCG TGTTTACTAT GATATAAATA AACCGTCTGG 882 0 

CAAACGAATT AATGCTATTC AAATTTTAAA TAAAGAGACA GGTAAGTTTG AAAATATTGA 888 0 

TTTAAAACGT GTATATCACG TAACGATGAA TGACTTCACA GCAT CAGGTG GCGACGGATA 8 94 0 

50 TAGTATG TTC GGTGGTCCTA GAGAAGAAGG TATTTCATTA GATCAAGTAC TAGCAAGTTA 9000 

TTTAAAAACA GCTAACTTAG CTAAGTATGA TACGACAGAA CCACAACGTA TGTTATTAGG 906 0 

TAAACCAGCA GTAAGTGAAC AACCAGCTAA AGGACAACAA GGTAGCAAAG GTAGTAAGTC 9120 

35 

TGGTAAAGAT ACACAACCAA TT GGTGACGA CAAAGTGATG GATCCAGCGA AAAAACCAGC 9180 

TCCAGGTAAA GTTGTATTGT TgtAGCGCAT AGAGGAACTG TTAGTAGCGG TACAGAAGGT 924 0 

TCTGGTCGCA CAATAGAAGG AGCTACTGTA TCAAGCAAGA GTGGGAAACA ATTGGCTAGA 9 300 

40 

ATGTCAGTGC CTAAAGGTAG CGCGCATGAG AAACAGTTAT TTCATAATCA ACAGTCATTG 9360 

ACGTAGCTAA GTAATGATAA ATAATCATAA ATAAAATTAC AGATATTGAC AAAAAATAGT 94 2 0 

45 AAATA 942 5 

(2) INFORMATION FOR SEQ ID NO: 88: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3886 base pairs 
so (b) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 88: 

AGTTGTAATG TCACATTTCC AGAGTCTGAA ATTAT CTTTA TCACGTTACA TTTACTAGGC 6 0 

£ TCTAAAATGA CTGAACATAC AGCATCTTCA ATTAC CTTTG AATAC CATGA TTTATCGCAA 120 

AATATACATG AATTGAT CAC TTGTGTTAGC CAAGAATTAG GCATTGATAT GTCAAAAGAC 180 

AACAAGTTAC ATACCAGTCT GATCACACAT ATCAAACCAG CTATACATCG TATTAAATAC 24 0 

10 

GATATGCTAC AACCTAATCC TTTGAGGCAA GAAGTTATGC GTCGCTATCC TCAAATCATT 3 00 

GAAGCCGTTA GCAAGCATAT TAGTCCAATT GAACAAGATG CTGCTATTCG CTTCAACGAA 3 60 

GATGAATTAA CATACATTAC AATTCACTTC GCATCAAGTA TAGAGCGTGT TGCAACACAT 4 20 

75 

AAACAATCAA TGATTAAGGT TGTCTTACTA TGTGGTTCTG GTATAGGCAC GTCACAACTT 480 

TTAAAATCAA AACTAAATCA CCTGTATCCT GaGTTnCACA TTTGGGAtGc CTATTc CATT 54 0 

2o TaTcAATTGG aAGaAAGTCG ATTATTG CAA GATAACATTG ATTATGTCAT TTCAACAGTA 6 00 

CCTTGTGAAA TATCAGCTGT ACCAGTTATT CATGTCGATC CATTTATCAA TCAACAATCT 66 0 

CGTCAAAAAT TGAATCAAAT TATCAATGAC TCAAGAGAAC AACGAGTCAT GAAAATGGCA 720 

2 5 ACTGATGGCA AGTCACTCGC AGATTTATTG CCTGAACATC GCATCATTAT AAATAAACAA 78 0 

CCATTATCAA TTGAATCCGC AATTGCAGTG GCTGTG CAAC CTTTAAT CAA TGATGGCATT 84 0 

GTCTATTCAA ATTATACAGC TGCAATTTTA AAACAATTTG AACAATTCGG GTCATATATG 90 0 

30 GTCATTAGTC CACATATTGC ACTTATTCAC GCTGGTACTG ATTATGTACA GAATGGTGTA 960 

GGTTTCGCAC TAACATATTT CACTGAAGGG ATTATCTTTG GTAGTAAAGC TAACGATCCC 1020 

GTTCACCTTG TAATTACATT AGCAACGGAC CACCCCAATG CACATTTAAA GGCATTGGGA 108 0 

35 CAGTTAAGCG AATGCTTAAG CAACGACTTA TATCGACAAG ATTTCTTAGA TGGGAATATT 114 0 

TTTAAAATTA AACAACACAT TGC TTTAACT ATGACAAAGG AGGCTTAATA ACGTGTCATT 1200 

AGACATTTTG TCAACAACAC GCATCATTGT AAAAGAACAA GTAAATGATT GGACTGAAGC 1260 

40 

TATAACTATA GCTTCTCAGC CATTACTACA AGAACAAATT ATTGAACAAG GCTATGTTCA 1320 

AG CAATG ATT GAT AGOG TT A ATGAACTTGG ACCTTATATC GTTATCGCAC CTGAAATTGC 13 80 

AATTGCACAT GCAAGACCGA ACAATGACGT ACATCAAGTT GGTTTAAGTC TATTAAAGTT 1440 

45 

GAATCAACAT GTGGCATTTT GTGATGAAGA TCACTACGCA TCTCTCATTT TTGTATTGAG 1500 

TGCCATCGAC AATCATTCAC ACTTATCTGT ATTACAAAAT TTAGCAACCG TACTGGGCGA 156 0 

50 TAACCAAACA GTCCAGCAAC TATTAACTGC AACAAATGCA CAAGACATTA AAAACATTTT 1620 

AAAGGAGCAT GATTAATATG AAAATTTTAG TAGTATGTGG CCACGGTTTA GGAAGTAGTT 1680 
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AAGTTGAACA TAGTGACATT ATGACAGCAA GTCCAGAGAT GGCTGACTTG TTTATTTGTG 19 00 

GTAGAGATTT AGCTGAAAAT GCCGAACGTC TAGGGGATGT CTTAGTTCTT GATAATATTT 18 60 

5 

TAGATAAAGC TGAATTACAA CAAAAGCTCT CAGAAAAATT ACAACAACTT AACATGATTT 1920 

AAAGGAGGTA CGACCTATGC AAGCAATCCT TAATTTTATA GTCGATATTT TAAGTCAACC 1980 

AGC CATTCTT GTTGCACTGA TTGCCTTTAT AGGTTTAATC GTTCAGAAAA AACCTGCCGC 2 04 0 

W 

AACGATCACT TCAGGAACCA TTAAAACGAT ATTAGGCTTC TTAATTTTAA GTGCAGGTGC 2100 

TGATGTCGTC GTTCGATCTC TTGAACCATT CGG C AAAATA TTCCAACACG CATTTGGTGT 2160 

js GCAAGGTATC GTACCTAACA ACGAAGCTAT CGTCTCACTA GCCTTAAAAG ATTTTGGAAC 2 22 0 

AACAGCTGCA CTCATCATGG TCTGTGGCAT GATTGTTAAT ATTTTAATTG CCCGCTTCAC 2 2 BO 

TAATTTAAAA TATATCTTTT TAACAGGTCA TCATACATTT TACATGGCTG CGTTTTTAGC 2 34 0 

20 AATCATTTTA ACAGTCAGTC ATATTAAAGG CTGGCTAACG ATTGTTATCG GCGCACTCGT 24 0 0 

ATTAGGATTA ATCATGG CAG TATTACCTGC ATTACTCCAA CCTACGATGC GAAAAATTAC 24 6 0 

AGGGAATGAC CAAGTAG CTT TAGGTCATTT TGGCTCAATC AGTTACTTTG CCGCAGTGCT 2 52 0 

25 GTAGGTCAAT TATTCAAAGG TAAGTCTAAA TCAACGGAAG AGATTAAATT TCCAAAAGGC 2580 

TTAAGTTTCT TACGAGAAAG TACAATTAGT ATCTCGATTA CGATGGCATT ACTTTACTTC 264 0 

ATCGCATGCT TATTTGCGGG CGTTAGTTAT GTACACGAAT CTATTAG TG A TGGTCAAAAC 27 00 

30 

TTTATTGTCT TTTCATTAAT TCAAGGTGTG ACATTTGCTG CTGGTGTATT TATTATTTTA 276 0 

ACGGGCGTTC GTTTAATCTT AGCTGAAATC GTCCCAGCAT TTAAAGGAAT TTCTGAAAAG 2 82 0 

CTTGTACCAA ATTCTAAACC TGCATTAGAC TGCCCTATTG TGTTCCCTTA TGCACAAAAT 28 8 0 

35 

GCAGTATTAA TTGGATTCTT TGTCAGCTTT ATTACAGGTG TCATCGGTAT GTTTATCTTA 2 94 0 

TTCTTATTTG GTGGCGTCGT CATTTTACCT GGCGTAGTTG CACACTTCTT CTTAGGTGCA 300 0 

ACGGCTGCTG TATTCGG TAA TGCAAGAGGC GGTATTAAAG GTGCTATTGC TGGCGCCGCT 30 6 0 

40 

CTAAATGGTA TCCTAATCAC GTTTTTACCA TTATTATTCT TGCCATTTTT AGGC GAATTA 312 0 

GGTGGTGCTG CAACAACATT CTCAGATACA GACTTTTTAG CTGTCGGTAT CGTGTTCGGT 3180 

45 AACGCAGTAA AATATATGGG ATTATTTGGT GCGATTCTAT TTATTATTAT CGTAGGTGCG 32 4 0 

ACAACAATTT TATTAAAAGG CCGTCAAAAA GAACAGCAAT AGTGTTAACG TAGAAATATA 33 00 

AAACACCGTC ACATATTGAG TGAATGCCCC TTTtATCAAG AGGAAAGCCA CTTACTTATG 3360 

50 GACGGTGTTT TGTATTATAT TAAATGATAC TTAGCCATAC TATCGACAGC TGCTAAAATT 34 2 0 

GCTTCTTCTT GTGT CGCAAT CGGTTCCCAA CCAAGTAATG TTTTTgCACG TTCGTTACTT 34 8 0 
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CCTAGACTCA AAATAAAGTC TGGTAATTTT TTAGTAGAAA CTTTTTGAGC TATTTCAGGT 3600 

CTCTTTTCTT TAATTAATTT TGCAATTTCC AACAAATTAA TTTGTCCATC AGCCGTCGCA 36 60 

5 ATAAATCGCT TGCCATTAG C TTGTTCATTT GTCATTGCCA AAATGTGCAG TTCAGCTACG 3720 

TCTCTCACAT CAACAACATT TAACGGAATT TGCGGTACAC GTTT CATTGA ACCATTCAAT 3 7 80 

AAATTTTCTA ATAAATGAAA GCTTCCTGAA ACGTGTGCAT CTAATGATGG CCCAAAAATT 384 0 

fO 

GCAACTGGAT TGATTGTGGC AAATTCTACT GTTGTATTTT CATTCT 3 886 

(2) INFORMATION FOR SEQ ID NO: 89: 

(i) SEQUENCE CHARACTERISTICS : 
15 (A) LENGTH: 4879 base pairs 

<B) TYPE: nucleic acid 
<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 



20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 89: 





GTCATCTATC 


AAAAATTTGG 


TATACAGACC 


GACAATTATT 


AATTAATAAT 


TTAATTTCCC 


60 


25 


AGGCAATACC 


AGTGATTAAA 


TATCCACAAA 


TACAACATAA 


AGAACAACCA 


TTAGAATCTA 


120 




TTTCACAACT 


TATATTGTCT 


AAGATGACAT 


CTAATCAATA 


GTGTTTAAAT 


TTCTCAGTGG 


180 




CTGTGAATGA 


GGTTTAAAAG 


TACTATAAAA 


CGTAAACTTT 


GATACTTTAA 


AATACG CAAA 


240 


30 


AAACGGTAAA 


CCCTAATTCA 


TATTATAGAG 


TTT AC CGTTT 


TATTTTTTAA 


CTTGCATCAT 


300 




AGTTATATTA 


ACATTATTGT 


TGGTAGTTTG 


GAT CAGTAAC 


CATTGCTTGT 


CCAGTATAAT 


360 




CAACCGTTAC 


AATTGAATAT 


TTTCCaTTTG 


CATTTGGGTC 


TTTAAAACTA 


AACACATACT 


420 


35 


TATAGTTGCC 


ATTATGTTCT 


T CAAT AGAAT 


AATCATTATA 


CACTTTATTA 


TTACTACCAA 


480 




ATTTS.TTTGC 


TTCATTATTA 


GCCGCATTTA 


AAGCTGTTTG 


GAAATTTGGC 


AATTGCTGTA 


540 




AAGCTTGATT 


TTTATTTCCA 


TTAAACGGAT 


AAATTTGACG 


TGCAACCGGC 


GCGGCATTTT 


600 




GnCCATAATA 


TGGTGCAACG 


TAACTTGATT 


TTTGATTATT 


ATTCGCTTGG 


TTATTACTTG 


660 




ATTGGTTATT 


ATTTGTTTGG 


TTTTGGTCAT 


TGTTTGTTG C 


ATTTGAATTA 


GATTGTTGCT 


720 




GGTTATCGTT 


TGCACTATTA 


TCTTTATTAT 


CTTTGTTTAC 


GTCTTTACTA 


TCATCTTTAT 


7B0 




TATCTTTCTT 


ATCTTTAGAT 


GAATCATTTG 


TTTTTTTATC 


TTGTTGTTCA 


GTTTTCGCTT 


840 




TATCATCTTT 


TTCTTTATTA 


CCGTCTTTTT 


GTTGGTCACT 


ATCTTGACCA 


CATG CAGCTA 


9C0 


SO 


AAAATAATGA 


TAATGCTAGT 


AAC CCTGTAA 


CTAATCTTTT 


CATACATATC 


TCCTCCTATA 


960 




ATTCGATATT 


CATTGAATAA 


TCTTGAAATA 


CATATCTACC 


ATGTGTATCT 


TTTCATGGCT 


1020 
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TAAGGTTCTT TTTATTATAC CCTAATTTTT GTTCATTATT ATTTAATTTT TGTGAATTTT 114 0 

ATGtTTkCTA TAAATTTAAT TATTTTACTT TAACAATTCA TTACGCATTT AGCATTTCAA 1200 

GGTATA CA CA ATATTTATTA CTATGATTTC ATTTTATCTG CTGCAAAAAC AAT CATTATA 126 0 

ACTCTTTTTC CATAATTAAA TCTGTATCCG TTACATCACC TGTTTGAAAA TGATGTTCAC 132 0 

CAACCACTTT AAATCCATGA CGTTTATAAA ATGCTTGAGC ACGAGGATTA TGCTCCCAAA 13 80 

CTCCTAGCCA AATTTTATGT TTATTATGTT CTTGAGCAAT TTTTTCGGCC AATTCTAT CA 14 4 0 

ATTGTGAACC TCTTCCGCCA CCTTGAAAGT CTTTCAAAAA ATATATGCGC TGCACTTCTA 15 0 0 

AATAGGTCTC CCCCATTTCT TCAGTTTGAG CACTATTAAT ATTCATCTTT ATATAAC CAA 156 0 

CATTCGCACC ATCTTCTTGa TAAAAATAAT GAAATGAATC TACATGGTTA ATCTCTTGTG 1620 

TAAATTTCTC TACAGTATAA TTGTCTTTAA AAAATTGATC AAAATCTTTG T CAT CATAGT 1680 

AAGAACCAAA CGTGTCATAA AATGTTCTAG TTGCTAATTC AACTAATTCA CTAGCATTTT 174 0 

GTTCTGAAAT TTCTTTGATT ATCCCAGCCA TATAAATCCT CCAATAAACA GTGATCGAAT 1800 

CAAAATATTA CTTATGTTAT TTTTCAGCCA AAACTATTTA AAAATACATT AACACAAATC 1860 

AATTACAAAT TGTATTGATT GTGTGTAACA TCAATAAATG ATACATTTAT TCCAGTAAAA 192 0 

TGG CCGTATT TTCAAAAGAG AAAAAGAGAG GATGTATCGT TGTGATAGAA ACATTTAAAG 1980 

CGTTTGTAAT TGATAAAGAT GAGAGTGGTA AAGTGACACC AACTTTCAAA CAATTATCG C 2 04 0 

CTACTGATTT ACCTAAAGGA GATGTGCTGA TTAAAGTACA TTACTCTGGT ATAAATTATA 2100 

AAGATGCTTT AGCGACTCAA GATCATAATG CAGTCGTAAA ATCGTATCCT ATGATTC CAG 2160 

GAATAGATTT AGCTGGAACA ATTGTTGAAT cCGAAGCACC AGGCTTTGAa AAAGGAGAAC 2220 

AAGTAATTGT AACGAGTTAT GACCTAGGTG TCAGCCATTA TGGCGGTTTT AGTGAATATG 22 80 

CGCGTGTAAA ATCAGAATGG ATTATCAAGC TTCCTGATAC TTTAACATTA G AAGAAT CAA 23 4 0 

TGATATATGG CACAGCTGGT TATACTGCCG GTTTAGCAAT TGAAAGACTT GAAAAAGTTG 24 00 

GAATGAATAT TGAAGATGGT CCTGTACTCG TTCGCGGTGC TTCAGGTGGT GTCGGTACTT 24 6 0 

TAGCAGTACT CATGCTTAAT GAACTTGGTT ATAAAGTTAT CGCAAGTACA GGTAAACAAG 2520 

ATGTTAGCGA TCAATTACTT GAACTTGGTG CCAAAGAAGT TATCGATCGA CTTCCTGTTG 2 5 80 

AAGATG AT C A TAAAAAGCCA CTCGCATCAT CAACTTGGCA AGCTTGTGTA GACCCTGTTG 26 40 

GTGGCGAAGG TATTAATTAT GTTACAAAGC GTTTAAATCA TAGTGGGTCA ATTACAGTTA 27 00 

TTGGTATGAC TGCCGGTAAT ACTTATACTA ATTCTGTATT CCCTCACATT TTAAGAGGTG 27 60 

TAAACATTTT AGGAATTGAC TCGGTATTTA CTG CTATGAA ATTAAGACAG CGCGTTTGGC 28 20 
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TTGATGAACT TCCAGAACAA CTTAACAAAG TAATTAAACA TGAAAATAAA GGGCGCATTG 2 94 0 

TTATCGATTT CGGTGTAGAT AAATAGTATT CATGAAAAAG ACATCCCGTT ATGCGAGATG 3 0 00 

TCTTTTTTAA TTTAGTATTT GATATACATA CCGCCTGAAT CTGGTTCGGT AGGTATAAAT 30 60 

CCAAATTTTG TATATAATTT ATCCGCTGGG TAGTCTGCAA TCAGAcTAAC GTATGTACTC 3120 

TCAACAGCCA CACCTTTAAT ATATTGCATA ATATGCTCCA TAATTAGACT GCCGTAACCT 3180 

TGAC CTTGGT AACTTTTCAA AACTGCAATA TCAACAATTT GAAAAACAGT TCCGCCATCG 324 0 

CCAATCACTC TACCCATACC AATTAACCGA TCTTTATCAT ACAAGGTTAC TGTAAATAAG 33 00 

GCATTAGGTA ATCCTTTTTC aGCTGTTCGC GCGTCTTTGG ACTCATACCT GCGTTAATCC 33 60 

TTAATGCGCA ATAATCCTCG CAAGTCGGAA TATCATATGT CACTTTAACC ATTATTTACC 34 20 

CCACTTTTCA TCACACAATA TATCAACCTA GTATAAATGT TTATTTACAA TAGTCTTATT 34 80 

CGCTTCTTTA AACACTTCAT GATGACTTGA AACATAACCC TCTGCATTCG CATCTGGTTG 3 54 0 

GATATATGTT TTAGCAAGGT TCGCTGCATT TGCACCATCA CTAAATGCAC TTG CAATTAG 36 00 

ATGTGATTTT GCATCATGAT AAACAATATC TCCACACGCA TAG AT AC CAG GTATA CTAGT 366 0 

TGTCGTATTA CCAAATCCTT TAACACGACA AT CATCATG C ATATCTAGCT TTGAAGATGT 37 2 0 

TtCACTCAAT AATGTATTAC AACGATCAAA CCCATGACTA ATAATGACAT CGTCAAATTT 3780 

AACTGTATGC CTATCGCCAC TTT CAACATG TTCCAAAACA ACTTCACTTA TATGCGTTTC 384 0 

ATCATCATTG CCGACCAAGT ATTTAATACG TGTTTTTGGG CATAGTTTCA CATTTAAATC 3 90 0 

TGTCACCAAC GTTTTCATCG CTTCATGACC ACTTACATCT TCTTTTCGAT AAACAACTGT 396 0 

CACGCTTTTA GCAATCTTGG CAATATCATG CGCCCAATCT AATGCTGTAT TTCCTCCACC 4 02 0 

TGATATTAAT ACATCTTTAT CTTTGAAACG TCTGTAACTT TGTACAACAT AATGTAAATT 408 0 

AGTTSATTGA TATCTCTCTA CACCTTTAAC ATCTAATTGT TTTGGATTAA TAATACCCGC 414 0 

ACCAATTGCA ATGATAACTG CTTTCGATGT ATATATTTCT CCCGCTTCTG TTTCAACTTC 4200 

GAAATGACGT TCTGCCTTTT TCCTAATATC TACCACACGT TCATTCAAAT GAACTTCCGG 42 60 

TTTAAAATAT AATCCTTGCT TAATTGTATC TTTTAAAATT TCATGACAAG GTTTTGGCGC 432 0 

AATGCCGCCA ATATCCCAAA TAATTTTTTC AGGGTAAATT CTCATCTTAC CCCCTAATTC 4 3 80 

AGATTGAACA TCTATCAATC TTACAGACAT ATCTCGCAAT C CAG CAT AAA AGCTTGCATA 4 44 0 

CAAACCAGAC GGACCGCCAC CAATGATTGT AACATCTTTC ATTATGTGCC TCCTATGACT 4500 

CTCTATATTC ATTTCTTTCA TTAACGTGCT CAAATTGATA ATTATTATCA TTTAAAGCCA 4 56 0 

TTATACTATT AATATTTATA TTGTTAAAAT AAATCGCATA GTTAGCCATG AATTATCAAT 4 6 20 
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GAAAGATGTG TATATTTTTT AGTTCTAGTT ATATTATTTT TTAAAAGACT CATCACGTGG 474 0 

TTCTTTAAGA ATTGCTTGTC TTAAAAGGAA AAATAGCAAC AATAAACCTG CAAGCATACC 4 8 00 

5 TGTGTGCCCA ATACCTGCAA AGCCTGCnAA TGCTTCTGGA GAG TATG ATT TAC CAGTGAC 4 8 60 

TTGGAAGAAT CCTTTTGTC 4879 
(2) INFORMATION FOR SEQ ID NO: 90: 

to 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1560 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 90: 
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ATAATGTCTT 


AGaTTGATTG 


GGAGTTTTTT 


TAATTTTTTT 


GAAATTAAAT 


TAATCTGTAs 


60 




yTAATAAAAA 


ATTTGAATAA 


CTGACACAyT 


TTTTTGATCA 


TAGCTAyATA CTTTGTGAAT 


120 




TAATTCACAT 


TATAATAAGA 


GTGAAGATAA 


GAGTATTATA 


AATnATCTTT 


AAATAAATAT 


180 


25 


ATGTGAAGTA 


AAAATTACAC 


GTTAGCATAT 


CGATTATGgT 


CATTTCkTTT 


AACATATTAA 


240 




CTgGGGaACG 


TTAAAAGTTA 


ACGGkTGATA 


TCyAACtAAA 


AACAAGGTCA 


CAGTAGTATG 


300 




TTTTAATCTG 


GCGTCTATTA 


CAAATAAAAA 


TTACATCTAT 


AATTATT CGT 


TTTCTTTTTT 


360 


30 


GAAAGTAATA 


GCCAATTAAT 


ATCATACATA 


CTGGAGTGAC 


TATAAGGAGG 


ACATTATTAT 


420 




GAGAGCAGCA 


GTTGTAACGA 


AAGATCACAA 


AGTAAGTATT 


GAGGACAAAA 


AGTTAAGAGC 


480 




TTTAAAACCT 


GGTGAAGCGT 


TGGTACAAAC 


GGAATATTGT 


GGCGTTTGTC 


ATACCGATTT 


540 


35 


ACATGTTAAG 


AATGCTGATT 


TTGGTGATGT 


TACAGGCGTT 


ACTTTAGGTC 


ATGAAGGTAT 


600 




TGGT^AAGTC 


ATCGAAGTTG 


CGGAAGATGT 


AGAATCATTA 


AAAATTGGAG 


ACCGTGTGTC 


660 


40 


TATCGCTTGG 


ATGTTCGAAA 


GCTGTGGAAG 


ATGTGAATAT 


TGTACAACAG 


GTCGTGAAAC 


720 


ACTTTGCCGT 


AGTGTGAAAA 


ATGCTGG TTA 


TACAGTAGAT 


GGTGCAATGG 


CTGAACAAGT 


780 




TATTGTTACT 


GCAGACTATG 


CTGTGAAAGT 


ACCTGAAAAA 


TTAGATC CAG 


CAGCAGCGTC 


840 


4S 


TTCTATTACA 


TGCGCAGGTG 


TGACAACTTA 


TAAAGCTGTA 


AAAGTAAGTA 


ATGTAAAACC 


900 




TGGACAATGG 


TTAGGTGTTT 


TTGGTATAGG 


TGGTTTAGGT 


AACCTAGCTT 


TACAATATGC 


960 




TAAAAACGTT 


ATGGGGGCTA 


AAATTGTTGC 


CTTCGACATC 


AATGATGATA 


AATTAG CATT 


1020 


SO 


CGCGAAAGAA 


TTAGGTGCTG 


ATGCTATTAT 


TAATTCTAAA 


GATGTTGATC 


CAGTTGCAGA 


1080 




AGTTATGAAA 


TTAACTGATA 


ACAAAGGATT 


AGATGCAACA 


GTGGTAACTT 


CAGTTG CTAA 


1140 
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TTTACCTGTT GATAAAATGA ACTTAGATAT CCCAAGATtA GTGCTTGATG GTATTGAAGT 12 6 0 

AGTAGGTTCA CTTGTTGGTA CAAGACAAGA CTTACGTGAA GCGTTTGAAT TTGCTGCTGA 1320 

AAATAAAGTA ACACCTAAAG TTCAATTAAG AAAATTAGAA GAAATCAATG ATATTTTTGA 13 8 0 

AGAAATGGAA AATGGTACTA TAACTGGTAG AATGGTTATT AAATTTTAAA AATATCAACT 144 0 

GACTATATAG ATAAAGAAGG TAGTGCTCTG AACACTATCA TTATTAATCA AACCCCGAGG 150 0 

TTTTCCTGAA AAGATAGTGG nAAATCCCCG TGTTTTTTGG GTTTGAGGnG GTTGTnTGTA 156 0 



(2) INFORMATION FOR SEQ ID NO: 91: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11014 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION : SEQ ID NO: 91: 

GTCCTGTnGC TGCAATGAAT ACGCCTAAAA ATCCAGGGAT GTAATGGATA CTTTGTGGTA 6 0 

GTACTAATGA TAGAAATGAT AAAAATGAAA TCACAAAGGC TACGCTCGCA AAAGCTTGAC 120 

ATGTACGCTT ATCGCCATAA TCTAACCCTG TACGTATATG TAATAAATAC TGTAATCCGA 180 

TACTTAAATA CATAATTGCC ACGCATAAGA AGAATGGGAA GAATGTCTTT TCAAAGTCCG 24 0 

GATATAGGCT GTTAGATAGG AAGACCATGA TGAACATATT AAACATCATA AACGAGACGT 3 00 

CTTTGAATGT AACTTGACCA AATCGATTTG TAAAAAATGT TTGATGAGAC CACATTAACC 360 

ATAAGAACAA ACTCATGACG ATGTATTTGA AAAATAAATC AGCTGAAATG G AAC CGTTTT 420 

GTGTTGTTAA AATCACATGT GCAATTTTTT GAATGGCATA GACGAAAATT AAATCAAAGA 4 80 

ACAACTCATG GAATC CTGCA CGCTTTTCAG CTAAATGTTT TGGTGTTAAT GCATTAACCA 54 0 

TAAAATTTTA ACTCCTTTAA GATGTGTAAT TAATTTACTA AGTATACTAT TTATTTTTTC 600 

TAGTGAATAG GGGCAGATTT GGCGATGAAG TGGAAGGAGA GGTGACTGCA AGGTAATTGC 66 0 

GGAATTAACA ATCATCAGCG ATTTAATATT TGACTGGAGA CGTCATGGTA ATAAAAAATT 720 

GATGAGAAAT TGATGGTGAA ACCAGCTGTG AATAsCGaTG cAATGATrsA TAGaATTTAA 7 80 

TTAGAGTCAT TACGCGaAAT GATTAATGAT AATTTGTGGT AAATCAAAGC aTAATTTTGT 84 0 

ACTATAGATG AGGATGATAG AGCATATTTA AGAGGGTGAA ATGTTAAAGT GAAACCGTTT 900 

ACGTTTCCGA TTGCCCAAAC AAATTACATC ATTGTATAAT ATGATTTGTT AAATGCATAA 960 

CAAGAATGAA AATGTAACAT ACGTAGCAAT TGGTTTCATA AATTGGATGT TAGTGGCGTA 102 0 
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TGACGAGAGT CGTATTAGCA GCAGCATACA GGACACCTAT TGGCGTTTTT GGAGGTGCGT 114 0 

TTAAAGACGT GCCAGCCTAT GATTTAGGTG CGACTTTAAT AGAACATATT ATTAAAGAGA 1200 

CGGGTTTGAA TCCAAGTGAG ATTGATGAAG TTATCATCGG TAACGTACTA CAAGCAGGAC 12 60 

AAGGACAAAA TCCAGCACGA ATTGCTGCTA TGAAAG GTGG CTTGCCAGAm ACAGTACCTG 132 0 

CATTTACGGT GaATAAAGTA TGTGGTTCTG GGTTAAAGTC GATTCAATTA GCATATCAAT 13 80 

CTATTGTGAC TGGTGAAAAT GACATCGTGC TAGCTGGCGG TATGGAGAAT ATGTCTCAAT 144 0 

CACCAATGCT TGTCAACAAC AGTCGCTTTG GTTTTAAAAT GGGACATCAA TCAATGGTTG 1500 

ATAGCATGGT ATATGATGGT TTAACAGATG TATTTAATCA ATATCATATG GGTATTACTG 1560 

CTGAAAATTT AGTAGAGCAA TATGGTATTT CAAGAGAAGA ACAAGATACA TTTGCTGTAA 162 0 

ACTCACAACA AAAAGCAGTA CGTGCACAGC AAAATGGTGA ATTTGATAGT GAAATAGTTC 1680 

CAGTATCGAT TCCTCAACGT AAAGGTGAAC CAATCGTAGT CACTAAGGAT GAAGGTGTAC 174 0 

GTGAAAATGT ATCAGTCGAA AAATTAAGTC GATTAAGACC AGCTTTCAAA AAAGACGGTA 1800 

CAGTTACAGC AGGTAATGCA TCAGGAATCA ATGATGGTGC TGCGATGATG TTAGTCATGT 186 0 

CAGAAGACAA AGCTAAAGAA TTAAATATCG AACCATTGGC AGTGCTTGAT GGCTTTGGAA 192 0 

GTCATGGTGT AGATCCTTCT ATTATGGGTA TTGCACCAGT TGG CGCTGTA GAAAAGGCTT 1980 

TGAAACGTAG TAAAAAAGAA TTAAGCGATA TTGATGTATT TGAATTAAAT GAAGCATTTG 2 04 0 

CAGCACAATC ATTAGCTGTT GATCgTGAAT TAAAATTACC TCCTGAAAAG GTGAATGTTA 2100 

AAGGTGGCGC TATTGCATTA GGACATCCTA TTGGTGCATC TGGTGCTAGA GTATTAGTGA 216 0 

CATTATTGCA TCAACTGAAT GATGAAGTTG AAACTGGTTT AACATCATTG TGTATTGGTG 2 22 0 

GCGGTCnAAC TATCGCTGCA GTTGTATCAA AGTATAAATA ATAAGAAAAC AGGTTATCAC 22 8 0 

AACA5TATTA ATtACATGTT GGCATAACCT GTTTTTATTT GTTTATGGAT TTATTGGGTA 2 34 0 

ATATTAGTCA TTTGATGGTT TAATTGCAAA TGCTCTAACA GGGAACCCAG GTGCATCTTT 24 0 0 

TGGTTTAGGG CTGATAGCGT AAATGATGGC GCCACGAGTT GGTAATTGAT CTAAATTAGT 24 6 0 

TAATAACTCG ACTTGGTATT TATCCTGACC AAGAATATAA CGTTCGCCAA CTAAATCACC 25 2 0 

ATTTTTTACA ACGTCCACAG ATGCATCGGT ATCGAATGTT TCATGACCAA CAGCTTCAAC 2 58 0 

ACGACGTTCT TCAATTAAGT ACTTCAAAGC ATCTAATCCC CAACC CGGTG CATGTTGTTG 264 0 

TCCGTTCGCA TCTTTGTTTT CAAACTTTTC AATATTAGGC CAACGTTTTG ACCAATCGGT 2 70 0 

ACGAAGTGCA ACAAAAGTGC CAGGTTCAAT AGTACCATGC TCTTTTTCCC ATGCTTCTAT 276 0 

ATGCGCACGT GTTACGATGA AATCATTGTT GTTCGCTACT TCTGTTGAAA AGTCTAATAC 2820 



564 



EP 0 786 519 A2 



AAAGTGAATT GGTGCATCAA TGTGAGTACC ATATTGCGTT ACAATATTCC AACGTTGCAC 294 0 

ATAGAAACCA TGATCTTTAA C CGTGAATAA AGTTGAAACT TCGCCTTTTT CAAACTCACT 300 0 

AAAACGTGGT ATTTCCGGAT CAAATGTATG CGTTAAATCA ACCCAAGTTG CTTGTTTTAA 3060 

AGTATTTAAT TG TTG C CAT A AAGGATATTG TGTCATAAAA TCACCCGTTT TTAGTTTATT 312 0 

ATATGATAAA TGCTGCGATT ATTCTTGGCG TTTAGCTTTA ACAGCATTCA CAAGCACAGT 318 0 

CAATGCATCT TTAACTTCTT CTTCTTTTCG CGTTTTTAAA CCACAGTCAG GGTTTACCCA 3 24 0 

GAATAATGAG CGGTC GATTT GTTGTAGTGA ACGATTGATT GCTGTAGTAA TTTCTTC TTT 33 00 

TGTTGGAATA CGTGGACTAT GAATAT CAT A TACACCTAGA CCAATACCTA AAT CATAATT 336 0 

AATATCTTCA AAGTCTTTAA TTAAATCACC ATGG CTACGA GATGTTTCAA TTGAAATAAC 342 0 

ATCAGCATCT AAGTCATGAA TAG CATGAAT GATTTGACCG AATTGAGAAT AACACATATG 34 8 0 

TGTATGGATT TG AGTTT CAT CACGAACTGA AGACGTTGCA AGTTTAAATG ATAAAACAGC 3 54 0 

AT CTTTAAG A TATTGTTCGT GATATTCAGA GCGTAATGGT AAGCCTTCAC GTAATGCAGG 360 0 

TTCGTCAACT TGGATAACTT TGATTCCTGC AGCTTCAAGT GCTAATACTT CTTCGTTGAT 366 0 

TGCTAAAGCA ATTTGATCTT GAACGACTTT ACGTGGTAAA TCAACACGTT CAAATGACCA 3720 

GTTTAGAATT GTTACAGGTC CAGTTAACAT ACCTTTAACT GGTTTATCTG TTAAGCTTTG 378 0 

TG CATAAACT GTTTCATCAA CAGTTAAAGG CGCTGTCCAT TTTACATCAC CATAAATGAT 384 0 

TGGTGGTTTT ACGGCACGTG AACCATATGA TTGCACCCAA CCGAATTTAG TTACTAAGAA 390 0 

AC CTTGTAAT TTTTCTC CGA AGAATTCAAC CATGTCATTA CGTTCAAATT CACCGTGAAC 396 0 

TAATACATCT AAGCCAATGT CTTCTTGAAT TTTAATCCAT CGAGCAATTT CATTTTTTAA 4020 

GAATGTTTCA TATGCTTCGT CTGTAATGCG TTTGTTCTTC CAATCTGCAC GGTATTTTCG 4 08 0 

AACTTCTCGG CTtTGTGGGA ATGATC CAAT AGTTG TTGTT GGTAAATCCG GTAAGTTCAA 414 0 

ACGTTTTTGT TGTTGTT CAA TACGTTGCGC GAATGGTGAT TGTCTTGAAG TACGCACGCT 4200 

TTCGAAATCA TAATCTAAGT TTTTGAATGA TTGATTTTGG AAACGCTCAT AACGTGCTTT 4260 

TAATTTAT CA TATTTAACAC TATCGTTTTG ATTAAATAGG CGACGCAATG CATCTAATTC 432 0 

GTCTAATTTT TCAGTTGCAA AGCTTAAGCC TTCGCCAACA CTTGTATCTA ATGTTTCATC 43 8 0 

ATCTAAAGAT ACTGGAACAT GTAATAATGA AGATGATGGT TGAATGACAA GTTCATTAGT 444 0 

GTGTGCTAAC AATTTATCGA TTAAGACTTT TTTAGCTTCA ATGTCACTTG CCCATACATT 4 50 0 

ACGACCATCA ATAATTCCAG CGTATAATGT TTTTGATTTA TCAAAATCTC CAGCTTCAAT 4 56 0 

TTGTTTAAGG TTATAGCCAT TATCATGGAC AAAGTCTAAA CCTATACCAC CAACAGGTAA 4 62 0 
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AACACCAGCT TTTTCGAAAT AGTCATAAGC TTCACGTGTA ATATTTTCAT AGCTTTCGCT 4 74 0 

GTCGTCTGTA ACTAAGATTG GCTCATCAAC TTGAATGTAC TCAGCACCTG CATCAATTAA 4 80 0 

TGATTCAAAC ACTTCTTTAT AAAGTGGTAA TAACGTTTTA ACTTTTTCTT CAAAAGTTTG 4 8 60 

GTGACCGCCT TTTGATAATT TAACAAAAGT AATCGGACCA ACAATGACAG GGTGAGCGTT 4 92 0 

AACGTTTAAA GATTGGGCAT ATTTAAAGCG ATCTAATAAT ACATTGCGAC TCACTTTAGG 4 98 0 

CTCAACATTG TCCCATTCAG GTACGATGTA ATGATAGTTA GTGTTAAACC ATTTTATAAG 5 04 0 

TGCACTTGCA ACATGGTCTT TATTACCGCG AGCAATATCA AATAATAAAT CATCATCAAT 510 0 

AGTTCTTCCT TGGAAACGTT CAGGGATGAT GTTGAATAAT AATGACGTAT CTAATATATG 516 0 

GTCATATAAA GAGAAATCAC CAACTGGGAT GCTATCTAAG TGATAGTACT TTTG t AATAA 52 2 0 

TAAATTTyCT TTATGTAGAT CAGTTAATGT TTGATCTAAT TCTTCTTTAG AAATCTTCTT 528 0 

TGCCCAATAA CTTTCGATGG CTTTTTTCCA TTCTCTTTTT CTACCTAATC TTGGGAATCC 534 0 

TAAGTTTGAT GTTTTAATTG TTGTCATAAT ATTGCCTCCT TGTGAGCAGT AATAGATTTT 54 0 0 

GAGTATGCTG CAAGTTCTAA TGAATCTTCG ACATTTTGAA ACGGTGTGAT AATG TATAAA 54 6 0 

CCATTAAAAT ATTCATGAAC AGTATCGATT AAATCCTTTG AAAG CTTAAG ACTTAGTTCT 552 0 

CGTGTTTTGG CTTTATCATC TTTAACTGCT TCAAATTGTT GTAAAATTTC ATCTGACATC 558 0 

TTGATTC CTG GCACTTCATT ATGCAAAAAG AGTGCGTTTT TGTAACTTGC GATAGGCATA 564 0 

ATGCCTATGA AAAATGGTTT GTTCAAGTGC TTAGTGG CAT GGTAAATTTC AATGATTTTC 57 0 0 

TCTTTGCTGT ACACGGGTTG TGTTATAAAA TAAGACATTC CGCTTTCTAT CTTTTTCTCT 57 6 0 

AATCTTTTGA CGGCACCATA TAATTTACGA ACATTAGGGT TAAAGGCGCC AgcGATGTTG 5 82 0 

AAGTGTGTAC GTTTCTTCAG CGCATCACCG TCAGTGTTAA TACCTTGATT AAATCTTAGA 5 88 0 

GCGAGTTCAG TTAATCCTTT AGAATTAACA TCATAGACAT TGGTTGCACC TGGTAAGTGA 5 94 0 

CCAACTTTTG AAGGATCACC AGTTATGGCT AATATTTCGT TAACGCCAAT GAGCGATAAT 60 0 0 

CCAAGTAAAT GGGACTGCAA GCCGATTAAG TTTCGGTCTC GACATGTAAT ATGTACGAGT 60 6 0 

GGTTCAATAT TGTAATATTG CTTAATTAAG CTAGCAGCAG CAATATTGCT AATTCTGACA 612 0 

GTTGCCAATG AATTATCTGC GAGTGTTACC G CATCTACAT TAGCTTTATC AAGTTTAGCG 6180 

ATATTTTCAA AAAATCTATC CGTGTCTAAA TGTTTCGGTG TATCCAATTC GATAATAACG 624 0 

GTTGGACGTT CTTGAACCTT AGATGTTAAT GATTGTCTAA CTTTATTTTG AGATGGATTG 63 00 

AAAAGTGCTT TCGTTGGTAT CGGAATCACT TTTTTGTCAT TAACAGGTTT AAGTGTCTGA 636 0 

ATAGATTCTT TAATAAATTT GATGTGCTCT GGCGTTGTAC CACAGCAACC ACCAATTAAA 6420 
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TACTTAAATT CACTATTTTC AATATCTAAT AAGCTGGCAT TTGGATAACA AGATAAGAAT 654 0 

GCGTGCTCTG GTAATT CAAT ATGTGTGAAA GACTCTTGCA TATGGTGCGG GCCATGATGA 66 00 

5 CAATTGAGTC CCACGATGTT TGCACCACAT TGAACGAGTT GTTTTAATCC TTCATTGATT 6660 

GCCTGACCAT TAACTAAGTA ATTTGTGTTT GAAGCGGTTA ATTGAGCAAT GATTGGAATG 6720 

TCGTATTTCT TTCTCGTTCG TGAAATGACA TTTGTTAACT CTTCTAGGTC GTAATACGTT 6 780 

w 

TCGAAAAGTA GCGCGTCAAC GCCTTCTTCA ATTAAGGTGT CTATTTGAAT TTCAGTATGA 6840 

TAAAGAATAG TTTGTAAGCT GATATCCTCT TGTTTGATAC CTCTAAACCC ACCAACTGTG 6 90 0 

(s CCTAATATAT ACGTATCTTT ATTTGCTGCT TTTTTTGCGA TGCGAACGGC GGCTTGATGT 6960 

ATTGCTTTAA CTTTATCTTC AAGACCGAAT CGTTTTAACT TTTCAAAATT TGCACCATAA 7 02 0 

GTATTGGTTT GAATGACATC AGCACCGGCT TCAATATATG AACGATGGAT GCGTTCAACT 7080 

zo TTATCTGGAT GGCTAAGATT ATATGCTTCT GGACAGGTGT CTAATCCTTC AGAGTATAAA 7140 

ATGGTTCCTA TAG CG C CATC AGCTACTAAA ACATTATCTT TCAATTGTGT GAGGAATTGA 7200 

CTCATTGAAT GCCTCCTTTA ATG CGTATTT GATGTCTGCA ATGAGTTCAT CAGGATCTTC 7260 

25 GAGACCAACA CTTAATCGGA ATAGAC CGAA AGTGATACCA CGTTCTTGTC TCACTTCTTC 7 3 20 

AGGTAGTGCA GCGTGAGACA TTGTTGCTGG ATGTGAAAGG ATCGTTTCAA CACCGCCCAG 73 80 

ACTCACTGAA ACGAGTGGTA ATGTCAGTGC ATCGACAAAT TGTTGTG CTT TAGACTCATC 74 4 0 

30 AGCTAAACGA AAGCCAATAA CGGCACCGCC ATTTTTAGCT TG TTCTAAAT GAGCAGTAGT 7500 

GAGTCCCGGA TAATAAACTT CTGAAATTTC ATCTTGCTTT ATTAAAAATG ACACGATTTT 7560 

TTGAGCGTTT TCGACAGATT GTTTAAATCT GATTGGAAAA GTTTTTAAAT G TTTAG CAAG 76 2 0 

35 

TGTCCAGCTA TCCTGAGCAG ATAACATATT GCCTGTACCA TTTTGTATTA AATAAAGAGC 76 8 0 

GTCACTAATT GCCTCATTAT TAGTTATGAC AGCACCAGCA ATTAAATCGC TATGTCCACT 7 74 0 

TAAAAATTTT GTAGCACTAT GAATGACAAT ATCAGCGCCA AGTAATAAAG GTGATTGACc 78 00 

40 

TAACGGTGTC AT AAATG TAT TGTCCA CAGC TAC CAGTAGT TCATGCTTTT CGGCTATTTT 786 0 

AGAAACAGCT TTGATAT CAG TAATTTTAAA ACAGGGATTC GATGGTGTTT CGATATAAAT 7 92 0 

45 TAATTTTGTG TTTGATTGAA TGGCACCCTC GATTTGTTCG AG CTTTGTAG TATCTACGGT 79 80 

TGTAAATTCA ATATTAAATC GATTCAAAAT TTGCTCAGTG AGGCGAAAAG TACCGCCATA 804 0 

TACATCATCG GGTAAGATGA CATGATCACC AGATTTGAAA GTCAAAAGTA CTGCTGAAAT 8100 

50 AGCAGCAATA CCTGATG CAA AAGCAAAAGC GAATTTTCCC TGTTCTAATC GTGCTAACTT 8160 

CTCTTCTAAA AGTTCACGGT TAGGGTTGCC cTTCGTGCAT AATCATATTT AACATCGCCA 82 2 0 
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TCCACACCTC TACGCCAATC GAATAT CACT TCTGTCTCTT TTGAAAGTGT CATACAATCT 8 34 0 

CTCCAATCTG AGCTTTATCT AATG CTTGG A TGATATCGCG TTCGATGTCT T CATAATTTT 8400 

5 

CAACACCTAG TGATAAGCGG ATTAAATACT CATCAATGCC ACGTTTATCT TTTTCAGCAT 84 6 0 

CTGG CATATC AACATGTGTT TGGGTGTAAG GGAAGGTCAC TAATGTTTCA GTACCTCCTA 8 52 0 

)o AACTTTCTGC AAAAATGCAA ATGTCTAAAT TTTCTAATAA TTTAGCGACG CTATAGG CCT 858 0 

TGTTAAGTCT TAAACTAAGC ATGCCAGTTT GCCCGCTATA TAGTACTTCG TCAATTGCTT 864 0 

GAAGTGACTG ACATTTTTTA GCAAGTTTTC TAGCGTTTGA TTGCGCACGC TCAATGCGTA 87 0 0 

, 5 AATGCAAAGT TTTAAGTCCA CGTAACAACA AATAACTATC TATTGGTGAA AGTGTTGCGC 876 0 

CAGTCATGTT GTGAAAATCA AACAACTGTT GCGCGAGTGA TTCATCTTTG ACGGTTACGA 882 0 

CACCTGCTAG TACATCGTTA TGTCCGCCAA TATATTTCGT GGCTGAATGT AAGACTATAT 88 8 0 

20 CAGCACCTTC TGCTAGTGGT GTTGAAAGAT AAGGTGTTAA AAAAGTATTG TCGATAATTG 8 94 0 

ACAATAAGCC TTTAGCTTTA CAAAGTTGAT AGTATGGCTT TACATCAATA GCAATCATTT 9000 

GTGGGTTAGA TATTGGTTCA ATGAATAATG CAACTGTTTT ATCAGTGATT TCTTTTTCAA 906 0 

25 CTTGTTCATA ATCTGTAAAA TCAACGTACT TAAATTTGAT ATCGTATTGT TGCTCGTAAA 9120 

ATTCAAATAA TCTAAATGTG CCACCATATA AATCGAATGA AACTAAAATT TCATCATGAG 9180 

GTTTAAATAG ATTACATATT AATTGAATGG CTGACATTCC ACTTGATGTA GCGAATGATG 924 0 

30 

CAATACCATG CTCAAGTTTG GCAAAACAGG TTTCAAATGT TGAGCGTGTA GGATTTTTAG 9300 

TACGTGTATA ATCAAAACCT GTCGATTGTC CTAGTTTTGG ATGCTTGTAG GCAGTAGATA 936 0 

AATGGATTGG ATTCGCTATA GCACCGGTTG AATCATCGGT TAATGTGATT TGGGCTAACT 9420 

35 

GTGTATCCTT CATATTAAGA CCCTCCTATA AGAAAAAATA AAAAAAGCTT CCGTCCTTCG 9480 

TACGCGAATG AATCGGATAA AAAGGACGAA AGCTTATGTT TCGCGGTACC AC CTTTATTT 954 0 

40 GTTATTC CAT CGCTGAAATA ACCTTATTCA GTACGCATTA AAAGTAAATA TGCTTACTGA 9600 

ACAATTATCA CAATTAAAGT CAGTAAGTAA GGATATAGTA ATGTGCTATC CCATACTTAT 9660 

TAACAAAAAA TCGTGCGTAA AGAATCCAGT ACGCCATTTA ACATCAATGT TAATACTGTA 972 0 

45 TCGCTATAAC GGGCGAACCC GTAGACACCT CATATTGGCA TCAACACTCC AAGGCCATTT 97 8 0 

TCAAACACGC TTTCAAAATC TTCTCTCAGC TACTAAAGAC TCTCTGTATA AG CAGGGTGT 984 0 

GTTTTACTTy CCTCTTTATT GTGTTTACGT TTCATTAAAC TGTTATAAGA TATTAATTAG 990 0 

50 CTTACAGAGT AAAAAAAGAT TTGTCAACAA TTATTCAGAA AATTTTGATT TAAAAGTTAA 996 0 

TTTGTTTGTG AAATTGTAAT TGGTATCTTG AAGTTGAAAA ATGAATTATT TTTTAAATAA 10020 
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TCAAATAAAA AGTGATGTGA GTGAATTGTC AAAAAGTGAA GATCAACGTA TTACTAAAAC 10 14 0 

AAAAGATGAA CAAATTAAGC AAATAGATAT ATCGGATATC AAACCGAATC CGTATCAGCC 102 00 

5 CCGAAAAACT TTCGATGAAA ATCATTTAAA TGATTTGGCA GATTCAATTA AGCAATATGG 10260 

AATTTTGCAA CCAATTGTGC TTAGAAAAAC AGTTCAAGGT TATTACATTG TAGTTGGTGA 10320 

AAGAAGGTTT AGAGCTTCGA AAATTGCTGG TCTAAAATAC GTATCAGCGA TTATCAAAGA 10380 

10 

TTTAACAGAT GAAGATATGA TGGAACTGGC GGTCATCGAA AATTTACAAC GAGAAGACTT 104 4 0 

AAATGCGATT GAAGAAGCTG AAAGTTATCA ACGTTTGATG ACAGATTTGA AAATTACACA 10500 

ACAAGAAGTA GCGAAACGAT TGAGTAAGTC GCGCCCGTAT ATAGCGAATA TGTTGAGGTT 10560 

IS 

ATTACATTTG CCGAAAAAGA TTGCTGACAT GGTAAAAGAT GGGCGACTGA CAAGTGCACA 1062 0 

TGGACGAACG TTATTGGCAA TTAAAGATGA ACAACAAATG CTTAGGTTAG CGAAACGGGT 106 80 

20 TGTTAAAGAA AAG TGGAGTG TCAGATATTT AGAAAACCAT GTTAATGAAT TAAAAAATGT 1074 0 

TTCGTCAAAG TCGGAAACAG ACAAAGTAGA TATAACTAAG C CTAAATTTA TAAAGCAGCA 10 8 00 

AGAACGACAG TTGCGAGAAC AGTATGGTAC CAAAGTAGAT ATATCAATAA AAAAATCGGT 10860 

25 TGGTAAAATC TCATTTGAGT TTGATTCACA AGAAGATTTT GTGAGAATAA TTGAACAATT 10 92 0 

AAATCGTAGG TATGGTAAAT AGTTACACAA TTTTATATAA TAACTCTTTG TGCAAGTGTA 10 98 0 

AATAAATTGT AATCAGTGAC ATTTGATTCT AGAT 11014 

30 (2) INFORMATION FOR SEQ ID NO: 92: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6022 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 92: 

40 

TCCCCTTATG GAATTTCACA TTCTAGTTTA CATAATATAT ATTATAGGAA GTTATATGTG 60 

TGTAACGCAA AAgGTACCCT ACAT CATAAT CATTATCTAA TATCGTCACA TAACTTACTT 12 0 

ATGCTATAAT CATGGTATTA TATTGTTTGG AGTGATTTGA TGAGATTTGT CTTTGATATT 18 0 

45 

GATGGTACGC TTTGTTTTGA CGGCCGATTA ATTGACCAGA CTATTATTGA TACATTGTTA 24 0 

CAATTACAAC ATGATGGTCA TGAACTTATA TTTGCATCAG CACGTCCGAT TCGTGATTTG 300 

50 TTGCCAGTTT TACCATCAGT ATTTCAT CAG CACACATTAA TTGGCGCAAA TGGTGCTATG 36 0 

ATTTCACAGC AATCAAAGAT TTCTGTTATC AAACCAATTC ATACTGATAC ATATCATCAT 42 0 
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GCTGCACAAC TTGACGCTGn AGAACGCGAT TTTTGAGCGT TTAGATCCAC ATAAGCTGGC 54 0 

CAGTTGTATT GATGTTGCAA ATATCGACAC GCCAATCAAG AkTATTTTAT TAAATATAGA 600 

5 CCCGGCACAA ATTACAACTA TATTAGACGA GCTAGATAAA TAC CAT CAAG AATTGGAAAT 66 0 

GATTCACCAT TCAAATGAGT ATAACATTGA TATAACAGCG CAAAATATTA A CAAATATAC 720 

TGCATTACAA TATATATTTG ATGCAGATGT TAAATATATA GCATTTGGTA ATGACCACAA 780 

10 TGATATTGTC ATGTTACAAC ATGCTAGTAG TGGCTATATT ATAGGACCAT CAGAAGCATA 84 0 

CACACACGCA ATATTGAAAC TTGATAAAAT CAAACACATC AATAATAATG CACAAGCTAT 900 

TTGCAAAGTC TTAAAATCAT ATAAATAAAA ACACCCCTAT CAAATGATAA T CATTATCAA 96 0 

15 

TCGATAGGGG CTATTTTAAT AAAATTCGTC CTCGAACATT TCTTCCTCTT CATCTAATCC 1020 

AAATAATT CT GCCATTTCTC CATGTTCAAT TAACATGTTT AAATATG CAT CGCGGAGTTC 1080 

TTCTTCACTC ATATCATTAA TCATTTCTTT AAGACTATCA AT C CACATAT TTCTGCGTAA 114 0 

20 

TTGATAGTCT TCTTCAACTT CGTTTAACAT CATTATATGT TTATTTGCTG CTTCTGGACT 1200 

AGCTGTAAAG AGTAATGCAA TCATATGTTT ACATATCACT CGTCTTCCAT CAGCATGAGG 1260 

25 ACAATTACAT ATGGATTTTC TAGGATGTTC CATATCAATA TAACAACGAT ATACTTTGTT 1320 

GCCACTGCCC TTTACTTCAG CCTCATGCTG CGTTTCTGAA AATGATTTTA AGTTAATGAC 1380 

GCATTCACTT TGATAATAAT TAAAGCCTCT TTCTATAGAA CGAATACTTG CAATATCAAG 144 0 

30 TAATCCCATT AATGaTACTC CTTTTTATTA TTATTTTTAA ATAAAGAaAA TAAAATAGAT 1500 

AAGTGT CTAG ATTAAAATAC TTGATTTATC TATATTTTAT AACAAGTCTA GAATTATCGC 1560 

ATTCTTAAAT AACTAATATG AAAATGc TTG CACTAATTCt TTTGTATAAG GGTGTCTATC 16 2 0 

35 AACATTAAAT AATTCCtCTA TTG CAAAATC ATCGACTATC ATGCCATCCT TAAGAACGAT 1680 

AATTCTATTA ACTAAGCGTT GTAACACGGA TAAATCATGA GAAATAACGA TAAAATGATT 174 0 

TAAGTTCGTA ATCGTTTGCG CTTTTAATAT ATTGATTACA TTTTGTTCAG CTATAACATC 1800 

40 TAAATTTGAA GTTATCTCAT CACATATTAA AACGCGAGGC TGTGCTAATA ACGAACGCAT 1860 

GACATTAAAT CTTTGTAATT GTCCGCCACT CACTTCGCTT GGTAATTTAG TCAATAATTG 1920 

CGCGTTTAAC TCAAAAGTAG ATAAATG TTG TAATAATAAT TGATCCTGAG CAGTATTATC 1980 

45 

AGTTAGACCT CTGTAATAAT ATAACGCTTC TTTTAATGAG GTCTCAATCG TCCAATCAGG 204 0 

GTTAAAGCTA GTTAAAGGGT GTTGGAAAAT CGGTAACACA GCATTGTCAC TTAAGTAAAT 2100 

CTCTCCTTTA A C AGGTTTAA ACAAGCCAAG AACCAATGAA GCGAGCGTAC TTTTACCACA 2160 

50 

GCCACTTTCG CCTAAAATAC CAACATTTTC TCCATCAGGT ATAGTAATAT TGATATCTTG 2 220 
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CCCTCTTTAA TTGTGTTCTA TATTTAATTA GACGTTCAGT ATACGGATGC AAATGCTCAT 2 34 0 

ACTTGAAATG ATTAATATTA CCTCGTTCAA TGATTTGACC TTCTTTTAAA ACATAAATGT 24 0 0 

5 ACTGACAATA TTTCAATACA TGACTTAAGT TATGTGTGAT AATAAATAAT GTTTGACCAT 24 SO 

GTTCTAATAC AATATGCTGT AATAAATCCA TCACTTGATT ACCGTTCAAA GCATCCAATG 252 0 

ATGCAACTGG TTCGTCTGCA ATGATTAATT TAGGCTCCAA CATGAGAACG CTTGCTATGT 2580 

'° ATACG CGTTC AAGTTGGCCC CCAGAAAGTT GGAAACTATA TTTATTTAAT ATATCTTTGC 264 0 

TTTGTAAATT AACCCACGAC AAAG CCTTAT CAACTTTGGA CAAAGCCTCT TCTTTACTAC 2 70 0 

CTTTATAATG CTTACGATAA ATCGCAGTTA ACTGTTTACC TAATTTAGTA TGGTCGTTAA 276 0 

IS 

AACTTT CTGC ATAATTTTGA GAAATATAGC CAATTGTATG ACCATAATAT TGACTCAATC 282 0 

TACTAACATT TTCCCCATCA AATTGGTACG AATCATACGT GCAGCTTAAA TCAAATGGTA 288 0 

AATATTCAAG TAAAGCTTTA GCAATCAAAC TTTTTCCAGC GCCGCTCTCT CCAATCAAGG 294 0 

20 

CATTAATCTG TTGACTAAAA ATTTTCAAAT CAATCCCTTT AATAAGAGAT TTCTCACTAG 300 0 

TATTCTTTAT TGTTAAATTT TGTATATCAA TGAGACTCAT CATATTCACC CCGTTGTTTC 3 06 0 

AGCAATCTAT CTCTTAGTGC ATCACCGGTT AAATTAAAAA TTAAAATAGT TATAGCAATG 312 0 

25 

ACTGAAGCAG GTGCAATCAA CATAATTGGA TGAGACGAAA TAAAATCACG ACCTTGTTGC 3180 

AACATAGCGC CCCaCTCTGG TGTTGGCGGT TGTGCACCTA ACCCAATAAA TGATAGTGAA 3240 

30 CTTATATATA GAATGATTTT ACCGAAATCA ACGACCATCA AAACGATAAT AGCCGGTATA 3300 

ATTTTAGGTG TTAAATGACG TATTAATATT GTTCTTGTTG GTACATGAAA TAATTGTGCC 3360 

ATTTTTATAT AAGGCTTATT CATTT CGCTA TTAACTATAC TTCTAGTCAA CCTTGTGTAA 34 20 

35 TTCATCCATT TTATTAATGT AATTGAGATA ACTAAATTCC ATAAAGATGG TTGAAAAAAA 34 8 0 

CTTGcTAAAG CAATCATGAT GATAAATTCT GGAATACTTA GACCAACATC AATAAACCTT 3 54 0 

AACACTAATC GTTCAATCCA CCCTTTTTTG TATCCGGCAA ATAGACCTAG TGTAACACCT 3 600 

40 ATGACAACGA TAGCTATTAA TGTTAAAACA GTAACAAACA ATGTTGAACG TGCACCGATA 366 0 

ATAATTCGGG TAAATAAATC TCTCCCATAA TCATCAGTTC CTAATAAATG CAACCAACTA 3720 

ATAGGTTCAA AAGTTTGTGA TAAATTGACT TTGGTTGCAT TTTCACTACT GACAAAGAAT 37 BO 

45 TGCAGTACAA TTAC CACAAA AATAAATGCA ACGAATACAA AAAATATCAG GTTATTCTTT 3 84 0 

GAAAATATTT TATGCATGAC GGTCACTACT TTCTGATATC AATGGTGTAT TGGTTTTGAT 3 900 

TTTTGGATTT CCTAATTGTA AACGCTGCTT CGGATCAAGT AATAACGTTA ATAAATCAGC 3 96 0 

50 

AATCGTATTG ATAATAACAA CGAAGAAGCC AATAAATAAC ACGCATCCTT GAATAACAGG 402 0 
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ATTTTCAATC ACTACAGTAC CACCTATTAG ACTGCCAAGT GAAATCCCTA GTAATGGGAT 414 0 

AATCGGCAAA ATTGTTGGTT TTAGTAAATC ATGAATTAAA ATATAACGTT CATTCATACC 4 2 00 

5 GCGTAATCTT GATGCTTGTA CGATATTACT TTGCAATAAC ATCAATAAAT TAGAACGCAC 4 2 60 

TAAACGAATG ATGTATGCAC ACATACCTAA AGATAGCGTG ATTACAGGTA ATATAAACTG 4 3 20 

ACTTAGTATA ACGCTATCTA TATTCATTAA ATTTGTGACA ATAAATAATA AAATAATACC 4 3 80 

10 

GATAAAGAAC GCTGGTAAAC TAATCGATAG TGTTGAGATC ACT CTAATCA CTTTATCCGT 44 4 0 

CCACTTATGA AATCGTTTGG CTGCTATAAT GCCGAGCGGT ATAGATATGC ATAACGACAC 4 5 00 

TACTAATGTT GAAAATGATA TGAGTAATGT TATGGGTGCA TAGTTGAATA ATATCTGTGT 4 5 60 

15 

TACCGGTTCT TTTGATTCAA AACTTTTTCC TAAATTAAAA TGTAATAAAT GATTCATCCA 4 620 

ATGCCACCAC TGTACCAATA AAGAATCATT TAATCCCAAT TTATCTTTGG TTGCATTTAT 46 80 

2Q TTGTTCCGTC GACACTTGTG CTACATCAAG ATGTAATATT TTATCAACAG GATTGCCTGG 4740 

TGATAATTTC ATTAAAATGA ATGTAAGTGT AGAAATAACA AATAAAACAA CTATCATTTG 4 8 00 

CATCAGTCTA TACAACATAG ACTTTATTAT GAACATAATA GTCCCCCTCC TTGTGTAAGT 4 8 60 

2s TACTAACACT TTCTTTTTAC ATGAGAATGG CGCATGTATA TGCAACTTAC ATATTAAGAA 4 920 

CTAACGTTCA TTATAGTATT ATCCATAAAG AAATTGAAGT ATATTTAATT TTTTAACAAA 4 9 80 

ATCATTATAA AATATAATAT TTTGAATCAA GTCAAC CATG TAAAATATAA AAAAGTCAAA 5 04 0 

30 ACAAAAACAA CTATAG C ACT GTATTCCATC TCTTTCGAAA TAATTGTTAC TGCAGTGTAA 5100 

CTTAAAAGTC GATGATTTTG TGCATATAGT TGTCGAATAT TATTTTTTAT CTTTACGGCG 516 0 

AAGTTCAGCG CCCTCATAGC CGTATTTTTC AATTTGCTTT TCTAATTTAC GCGCTTTTCT 52 20 

35 TTCTTTACGC CAATTTCTAG TAAAATACCA TAATAGAAAA CTAATTAATA AACTCATAAT 52 80 

CGCTAAAAAT GCAGCGTATC CTAATAATGG TTGATATTTT ATATCTTGAA AATTTGGAAT 53 4 0 

AAAAAATGCA AGCACACCTA ATATAACAAA TGTAATTACT GCAGATACAA ACCATTTATT 54 0 0 

40 TAAAACTAAG CAACAGAATA TTGTTAATAA AATCATTATT AATGTTGTGA TCCATAAATA 54 60 

ATTAGGCATA TCGAATAATG TCATATTCAT TCTCCTTTTA TTTCATTACT TTCCTTGTAT 5520 

ACATTTTATT ATAAATTTTT AAAAACTTAA ACAATAGCAG TCAGTTT CAA GCAATATTCT 55B0 

45 

ATCTACTAAT AGAAAAATCA TTGTTCCTTG CGACATGGAA ATCGTAA CAT TATCGTTTAG 5640 

GAGACAAAAT TATGTATAAT GAATGTATTA TACCAAAGGA GTGATTATAT GTCT CAAGGT 5700 

TTAC C TTT A A GAGAAGATGT TCCTGTTTCA GAAACATGGG ATTTAGTAGA CTTATTTAAA 5760 

50 

GATGATCAAC AATATTATGA AAGTATTGAC GCTCTAGTAC AnCAAGCAAA TCAATTTCAT 5820 
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GAAAATATTT TAATTGCCTT AGATCGCTTA AGTAATTATG CAGAACTACG TTTAAGTGTA 594 0 

GATACTAGTA ATATCGAGGC ACAAGTATTG AGCGCTAAAT TATCTACTAC ATACGGTAAA 6 000 

5 ATTGTTAAGC CAATTATCCT TT 6 022 

(2) INFORMATION FOR SEQ ID NO : 93: 

(i) SEQUENCE CHARACTERISTICS : 
w (A) LENGTH: 476 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 93: 

CCATCAATAA TGTATACATG ATTGG CAT CA TATTCCCCTT TAATTAGAGA GCTACGTACA 6 0 

GTTTGTyTTA TTAAAGTAGA ACTAATAAAT AACCATCTCT TATGTGCACA AACACTTCCC 12 0 

20 

GCAACAATTG ATTCAGTTTT ACCAACCCGT GGCATACCTC TAATGCCAAT CAACTTATGA 180 

CCTTCTTCTT TGAACAATTC AGCTAAAAAG TCTACTAACA AGCCTAAATC TTCACGCTCA 24 0 

25 AATCGAAAGG TTTTCTTATC TTTTG CAT CT TGCTCAATAT ATCTTCCATG TCTTACTGCA 300 

AGACGGTCTC TTAATTCTGG TTTTTTAAGC TTTGTTATTT CAATTTCATT TATACCACGA 36 0 

GCTATTTGCT CAAAACGTTC AACTTTTTCA AGATTGTCTG TTTTAATTAA AAGGCCTCGT 420 

30 TTACCTTGAT CAACACCATT AATTGTAACA ATACTTATAC CTAACATACC TAATAA 4 76 

(2) INFORMATION FOR SEQ ID NO: 94: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3633 base pairs 
35 (B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
r (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 94: 

AGAAATACAA CGAAGCATAT AAATATAACC GATCTTTTTT CTAATTGAAT ATTAAGTAAG 60 

TGTATGTACT TTCTGGAAGT AGCACCTAGT rGGATTGTt C CTCCTACAAC AGGCCAAAAA 120 

TTTTTATTTT TAACTGG CTT AACAGTGTTC AGTTTTTCAT ACTCTTCTCT ACTAATTTTG 180 

GCGCACCTTT TTGGAATGAA CCAATTAATA AATGGAAAAA AGTATACAAG CCAAGTTCTT 24 0 

ATTACATCGA CCATTAAATA CTCATCATCA TACTTAATAA CTCTGTATTT CGGATTTTTA 3 00 

TTGATAATTT CGGTTTCACA AAGCAATAAT TATCACTTCC TATTAATAAC AAATTCACAC 360 
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TTATATGACC TTAAATATAT AACATGAATC TTTTTGTCTA TTATTGAAGA CATATTTATA 4 80 

AAGAAAAATA GCATTGTCAT AATAACCCAA GCAATAAATA CTATAATATT TTGGATAGAT 54 0 

AAACTAATCA rrACATCTAA GAACATGATT gATAATCCAC CACAGAAAAA ATAAGAAAAT 60 0 

AGTACAAAGC AAAGATTCTT GAATGATGGA AAAATCATAA TTTTTCCATT GCTACTCCGA 66 0 

TCATTATAGA TAGATAACTT TACTTTCTGA TTTAAATATA TATAAAACAC TAGAATACTT 72 0 

AATAATAAAA CCGAACAAAT GATAATAACG CAATTTTTTT CTAAATGAGA ATCAGGTATA 780 

TATATTTTAT CT CTAAACAT AGTGCCAAAT AAAAGTATGC TAC CT AT AG C TGGCCATAAA 84 0 

GCTTTaTTTT TAACTGGTTT GACAATATTT AAATTATCAA AATCTTCTCT GCTGATTTGG 90 0 

ACATATTTTT TTGGTATTAA CCAATTAATA AACGGAAAGA ACAAAACTAA CCAGGTGCTT 96 0 

ACTAAAT CAA TCATCAGATA GTCGTTTTTA TATTTAATAA TTCTATATCT GGGATTTTTG 102 0 

TTTACAACTC TAACCTCGCA AAGCAATATC TCCACTTCCG TCTCGTTGGT TTTATATCTA 108 0 

ATA CACTTT C AGATACTTTA TAAGTGTTTT GTATTTTAGT AACATACTAT TTTCCTGTTT 1140 

ATTACTTAAC TTACGAACTA CAATCTAAGT TTAGTAATTT CTATTGCTTT TTAAGTTTGG 12 0 0 

CATAAACCTT TTTATTACTA ATTGAGCCCA TGCTTATTAG AAAGAAAAAA ATTGTAATAA 1260 

TAATCCACAT AATAAATACC AGTAGATTTT GAGGTTTTAT AGTCATT AG C CATATTAAAA 13 2 0 

ATAATATAGA ACAACCTCCT AATAATAGAT ATGTGAAAAC TATAAAACTT CCATCTTTAA 13 8 0 

AAGTAGG CAC TAATATAACC CTATTTTCAT TATCTAGATT ATCAT CAT AT ATCTTTAGTT 144 0 

TAAGCTTTTT ATTTAAGTAA ATGTAAAATG CTGCAATACC TATAAATCCT ATAAAACATA 150 0 

AAGATATTAA AATCTTATTA TCTAAT TGAA CTTCAAACGT ATGTACATAT TTCCGTAAAA 156 0 

TAACTACAAA TAAAAACGAA CTACCAGTAA CTGGCCAGAA AATATTATTT TTATTTTGTT 162 0 

TATCAACATT TAAATTTTCA AGTTCCTTCT CACTAAGTTT TGCATACCTT TTGGGAATGA 168 0 

ACCAATTAAT AAAAGGAAAA AAGTATACAA GCCAAGTGCT TACTAAATCA ATTAACAAAT 174 0 

ACTCATCATT AT ATT G AACG ACTTTATATC TCGGATTTTT ATTAATAACC TTAATATTAA 1800 

AAAGCAAAAC TCACCACGCC CATTTCATTG GATTTATATG ATTGCTAATA ATATTTTTAG 186 0 

CTTCACTAAC AGCATTCCCA ACACTATCCA TGGATTTTTC TGTAGTTTTT TTAACAACAT 1920 

CTATACTATT ATCGATTTTA TGCCCTACCC AGTCTACTTT ATCTTTTAAT CCAAAAATAT 19 80 

TATTTTGATA AATTAAATCT GTTCCTAATG CAAATACTGT ACTCATAGCC AAACCTGCTA 2 04 0 

AAATCACCCA TCCTACTGGA TTACTTCCTA AAACAAAAGT CGCTAATCCA GCTCCAACTG 2100 

CTGTCCCTGC AGATCCAGCT GCAAGCGTgC ATACCATTAT GCGACAACGC CTCTCCAAAT 216 0 
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CCTTTACCTA GGTATTTTCC GCCTTTTGCA AATTTACTAC CATTTTCTAT AAACACATTA 2 28 0 

CCTGATGTAC GTTTGACTTC CACAAATGAA TTTGGACCTG CTGGGCCTTT CACTCCACCT 2 34 0 

GCTGTATTGa TAAATACACC GAATTTACTT GcATTTATAC CGTCTTGCTC TAAAAGTGTT 24 0 0 

GACGTAATAT CTAATCCTAT AT CT CTTTTA ATACTGTCTT TATTGTCATT TATATATTTC 24 6 0 

AATATACTTT TCGGGATATC GTCTTCTGGA TGTTCTTTGG CATATGCCTT TATAACAGCA 2520 

AAGTCTGCTT TATTTAAAGT TTCTTTCTCT GCTTTATGTT CAATTTTCCC CAT AG CAACT 258 0 

TTCAAATATT TTTCATGACT TGCTTTGGCC CAATCAAGTT CTTTACCTGA AGGAATATTA 2 64 0 

AATTGATTTG TTGAAAAGTT CCAAAAATTC TGCGCTTGGG TAAGTCCTTG TTGGACAATT 270 0 

TTTTGAAATT CTTCAACTTC TTTAAATATT TCTGGTGATT TTTGATTAAA CTCACGCAAT 276 0 

TTGCGTAGCT TCTCTTCTAA TTCATGTTTT TGTTGACCTA ATGTTCGTAT TATTTGTTGG 2820 

TTCGATGAAA TGGCTTGCTG ATTATCGGAA GCATGCTTTT TCAAATTGTT ATTCAAATTT 2880 

TCATATCGCG TAATTTGTTG ACTTAATGAT CTGATATCTT CTTCAAGCTC TGATTCTTTT 2 940 

AAAGATATGC TATCAACCTC ACTCGTATAA CGTGACACAA AATTaTCGCA AGCTTGCTTC 3 000 

GTTAAATCAC TCAATGTTTT CATACTTGTT GATAATGGAA TTAACA C CGT ACTAAAAAAT 3 060 

TGCTTAGCTG ACGTATACGC TTTCCCTTTA AGCGCATCAT CATTAATAAA TTGAGTAATT 3120 

GCTTTTTCCA ACGCATCATA ATTTGAATTC ATTGTTTGAC TCAAATTCCC CACACTTGAA 3180 

GCTTGGTTTC GAGATCTGTC TAAATACATG TCAATACTCA TCGGCATGCT CCTTTTTCAA 324 0 

AAATATATGA TTTTCAAACT ATTTAAAATC AAATGCTTTT TACATCTACA AAGTTGTAAA 33 00 

ATTTTAAAAC TCGGCGATGA TTATTTCTTA TGTAAAGGAG TCTAGATGCA GGTAAATTGA 3 360 

GATAACATGT CGCCTTTTTT CTTATTTTAG CATATGGATA TAATGGTGTC TTTGTATATT 3 420 

CGCAATTAAT CAATAAAAAT TATCTTTCAA TATTTTAATT TTATTGCGAC AACATCCTTA 34 80 

ACATTAAATA TATTAATATC TCAAAATATA TTCACTATTA AAATATGTCA TCAGTTGTTA 3 540 

AAAGTATTTC CTCATCATGC GAAATATCAA AACGTATCTA AAATACGAAT AAGTTTATAC 3 600 

AATCACACAA CATCATCATT CAAAATTTTA TTG 3 633 
(2) INFORMATION FOR SEQ ID NO: 95: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2365 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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TGATACGAAt GCATTACAAT TCATATGCAA CATACAATTC CTTCTACAGC AAATGAAGTG 6 0 

AAACAAATAG TTGATGTGAC ATCTGTAGCA GAAAATGATA CGCATTAGTC ATAAAATTAA 120 

5 ATGGAAATGT CGATGAAGTG TATCAGCAAT TACAGCGATT AATTAAGAAT GCTAATGTCG 180 

AAGAGAGTGA GAATA CTGAC AATATTAATA GTCAAGATAC AAGTTATACA CCTCAAGTAA 24 0 

AAGTAACAAC ACCAATTTTA GTGAAAGCAC CAATCGCTGG TCGTCGTATT TTACTTAAAG 3 00 

AAGTAAGAGA TTCAATTTTT AGAGAGAAAA TGGTAGGTGA AGGCTTAGCA ATCAAAGCTC 3 60 

ATGAAGAATC CAAAGTAATC GCACCGTTCA ATGG TTTAAT ATCTATGATT GTACCAACTA 4 20 

j5 AGCATG CAGT TGGTATTCAA TCAGAAGACG GTGTGGA CAT AGTCATTCAT ATTGGCGTGA 4 80 

ATACAGTTGA CTTGGAAGGT AAAGGGTTCA AGTGCTTTGT AAAGCAAAAT GAT CATGTTG 54 0 

AAGCAGGGCA AACGTTGTTG CAATTCGACC AGCAATATAT ACAACAACAA GGCTACAATG 600 

20 CTGACGTTAT TGTCGTTATT AGCAACTCTG CCGATTTAGG AAAAGTAGAA CTGACAATGA 660 

ATGAAATCAT TACGACTGAA GATGTTATTT TTAAAATATT TAAAAACTAG GAGTGTGTTG 72 0 

TAATAATGAC AAAATTACCG CAAAATTTCA TGTGGGGTGG CGCTCTTGCC GCAAATCAAT 78 0 

25 TTGAAGGTGG ATATGATAAA GGTGGTAAAG GGTTAAGTGT AATTGATGTT ATGACGAGTG 84 0 

GTGCACATGG CAAAG CACGT CAGATTACAG AATCTATAGA TCCCAATCAC TATTATCCAA 900 

ATCATGAAGG TATTGATTTT TATCATCGTT ATAAGGAAGA TATTGCCTTG TTTAAAGAAA 96 0 

30 

TGGGATTGAA ATGTTTACGT ACGTCGATTG CGTGGACACG TATCTTTCCG AATGGGGATG 102 0 

AAGATGTGCC AAATGAAGAA GGACTCGCCT TTTATGATCG TATCTTTGAT GAATTAATTG 108 0 

35 CACAAGGTAT TGAACCTGTT GTGA CGTTAT CACATTTTGA GATGCCACTT CATTTAGCGA 114 0 

AACATTATGG TGGATTTAGA AATAGAGAAG TTGTCGATTA TTTTGTG CAT TTTGCGCGTG 12 0 0 

TTGTATTTGA AAGATATAAA GATAAAGTTA CATATTGGAT GACGTTTAAT GAAATTAATA 126 0 

40 ATCAGATGGA CACATCAAAT CCTAT CTTTT TATGGACGAA TTCTGGGGTA GCATTGACAG 13 2 0 

AAAATGATAA TCCTGAAGAA GTCyTGTATC AAGTAGCACA TCATGAACTT TTAGC CAGTG 13 8 0 

CyTTAGCAGT TCGTCTTGGT AAAGaGATtA ATCCgAaGTT TAAGATTGGr ACmATGATT t 144 0 

45 CAmaTGTACC CmTTTATCCa TAwTCGTGTC ATCCGAAAGA TATGATGGAA GCACAAATTG 150 0 

CGAATCGCTT ACGTTTCTTT TTCCCGGATG TCCAAGTGAG AGGTTATTAT CCAAGCTATG 156 0 

CTAAAAAAAT GTTGGCACGA AAAGGATATG ATGTTGGATG GCAAGAAGGG GACGACAGTA 162 0 

50 

TTTTACAGCA GGGCACGGTT GATTATATTG GCTTTAGTTA TTA CATGTCT ACGGCTGTAA 1680 

AACATGATGT TGATACTACA GTTGAAAACA ACATCGTCAA CGGTGGTTTG AATCATTCTG 174 0 
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GATATACATT GAATGTGTTA TATGATCGTT ATCAGTTACC ACTTTTTATT GTGGAAAATG i860 

GTTTTGGTGC AGTTGATGAA GTGGTAGATG GACATATTCa TGATGATTAT CGCATTGAAT 192 0 

ATTTAAAAGC ACATATTACA GCAGCGATAG AAGCAGTTGA TCAAGATGGT GTAGATTTAA 1980 

TCGGTTATAC ACCGTGGGGA ATCATTGATA TTGTTT CATT TACAACCGGT GAAATGAAGA 2 04 0 

AACG CTATGG TTTAATATAT GTTGATCGAG ATAATGATGG TCATGGCACG ATGGAACGCT 2100 

TGAAAAAAGA TTCGTTCTAT TGGTATCAAC AAGTGATAGC ATCAAATGGA GATAAATTAT 216 0 

AAAGGTATAT TATAAGTATT TTAGGGTTAG AGCCCGAGAC ATAAATTAAT ATAGTAGGAC 222 0 

CTACAGTGTT ATAATGGCGG gCCCCCAACA CAAAGAATTT CGAAAAGAAA TTCtAcAGGT 22 80 

aATGCaAGtT GGCGGGGcCC AACA CAG AG A AATTCGAAAA GAAATTCTAc AGGTAATGCA 2 34 0 

AGTTGGGGAA GGACAGAAAT AAATT 2 3 65 
(2) INFORMATION FOR SEQ ID NO: 96: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11050 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 96: 

CTGCGATACG ATTTGTTGAA AGTGGGGAAA ACAAAAAAGT TATCATTACC AATTTAGAGC 60 

AGGCATACGA AGCTTTGATT GGTAATAAAG GTA CACACAT TCACATGTAG CACTTTATCA 12 0 

CGCGACAAAA CATTAAATAT GTTTCTCCGT TGATTCAAAT GAAAAAGTTG TCTGCTGACA 180 

CTTTGCAAGG TTTGAAGGAG TTTAACTTAT GACAGAAAAC TTTATTTTGG GTAGAAATAA 24 0 

T AAATT AG AA CATGAACTAA AGGCATTAGC AGATTACATT AATATACCAT ATAGTATATT 3 00 

ACAACCATAT CAAAGTGAAT GTTTTGTCAG ACATTATACG AAAGGCCAAG TTATTTATTT 360 

TTCGCCACAA GAAAGTAGCA ATATTTACTT TTTAATTGAA GGTAACATTA TTAGAGAACA 42 0 

TTACAATCAA AATGGAGATG TATATCGTTA TTTTAATAAA GAGCAAGTAT TATTTCCAAT 4 80 

CAGTAACTTA TTTCATCCGA AAGAGGTTAA CGAATTGTGT ACAGCATTAA CCGATTGTAC 54 0 

AGTTCTTGGA TTGCCTAGAG AATTGATGGC CTTTTTGTGC AAAGCTAATG ATGATATATT 60 0 

TTTGACACTT TTTGCATTAA TAAATGATAA TGAG CAGCAA CACATGAACT ATAACATGGC 66 0 

ATTAACAAGT AAATTTGCTA AAGATCGAAT TATCAAATTG ATATGCCATC TATGTCAGAC 72 0 

AGTAGGATAC GATCAAGATG AATTTTATGA AATCAAACAG TTTTTAACTA TTCAACt CAT 78 0 
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TGAAAAACTT GTTGTTAAAG ATCATAAAAA TTGGTTAGTA AGCAAACATT TATTCAATGA 900 

TGTATGTGTT TAATATACAA TGTAAAATGA ATAAGTTGAA CATGAGGTCT AACGTACATT 96 0 

TATACGTTAG GCCTTTTTTG C TAG CATGAT GAATAATTTA AAATGTTAGT TAAATTTGAT 102 0 

TGTTGAAATT ACAGTAAAAT TTAAGGTGAT GAAAAATTTA GAACTTCTAA GTTTTTGAAA 10 80 

AGTAAAAAAT TTGTAATAGT GTAAAAATAG TATATTGATT TTTGCTAGTT AACAGAaAAT 114 0 

TT TAAGTT AT ATAAATAGGA AGAAAACAAA TTTTACGTAA TTTTTTTCGA AAAGCAATTG 12 0 0 

ATATAATTCT TATTTCATTA TACAATTTAG ACTAATCTAG AAATTGAAAT GGAGTAATAT 12 6 0 

TTTTGAAAAA AAGAATTGAT TATTTGTCGA ATAAGCAGAA TAAGTATTCG ATTAGACGTT 132 0 

TTACAGTAGG TACCACATCA GTAATAGTAG GGGCAACTAT ACTATTTGGG ATAGGCAATC 13 80 

ATCAAGCACA AGCTTCAGAA CAATCGAACG ATACAACGCA ATCTTCGAAA AATAATGCAA 144 0 

GTG CAGATTC CGAAAAAAAC AATATGATAG AAACACCTCA ATTAAATACA ACGGCTAATG 150 0 

ATACATCTGA TATTAGTGCA AACACAAACA GTGCGAATGT AGATAGCACA ACAAAACCAA 156 0 

TGTCTACACA AACGAGCAAT AC CACTACAA CAGAGCCAGC TTCAACAAAT GAAACACCTC 162 0 

AACCGACGGC AATTAAAAAT CAAGCAACTG CTGCAAAAAT GCAAGATCAA ACTGTTCCTC 168 0 

AAGAAGCAAA TTCT CAAGTA GATAATAAAA CAACGAATGA TGCTAATAGC ATAGCAACAA 174 0 

ACAGTGAGCT TAAAAATTCT CAAACATTAG ATTTACCACA ATCATCACCA CAAACGATTT 18 00 

CCAATGCGCA AGGAACTAGT AAACCAAGTG TTAGAACGAG AGCTGTACGT AGTTTAGCTG 186 0 

TTGCTGAACC GGTAGTAAAT GCTGCTGATG CTAAAGGTAC AAATGTAAAT GATAAAGTTA 192 0 

CGGCAAGTAA TTTCAAGTTA GAAAAGACTA CATTTGACCC TAATCAAAGT GGTAACACAT 1980 

TTATGGCGGC AAATTTTACA GTGACAGATA AAGTGAAATC AGGGGATTAT TTTACAGCGA 2 04 0 

aGTTACCAGA TAGTTTAACT GGTAATGGAG ACGTGGATTA TTCTAATTCA AATAATACGA 2100 

TGCCAATTGC AGACATTAAA AGTACGAATG GCGATGTTGT AGCTAAAGCA ACATATGATA 2160 

TCTTGACTAA GACGTATACA TTTGTCTTTA CAGATTATGT AAATAATAAA GAAAATATTA 2 220 

ACGGACAATT TTCATTACCT TTATTTACAG ACCGAGCAAA GGCACCTAAA TCAGGAACAT 22 80 

ATGATGCGAA TATTAATATT GCGGATGAAA TGTTTAATAA TAAAATTACT TATAACTATA 234 0 

GTTCGCCAAT TGCAGGAATT GATAAACCAA ATGGCGCGAA CATTTCTTCT CAAATTATTG 24 0 0 

GTGTAGATAC AGCTT CAGGT CAAAACACAT ACAAGCAAAC AGTATTTGTT AACCCTAAGC 24 6 0 

AACGAGTTTT AGGTAATACG TGGGTGTATA TTAAAGGCTA C CAAG AT AAA ATCGAAGAAA 2 52 0 

GTAGCGGTAA AGTAAGTGCT A CAGATACAA AACTGAGAAT TTTTGAAGTG AATGATA CAT 25 80 
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ACCAATTTAA AAATAGAATC TATTATGAGC ATC CAAATGT AG CTAGTAT T AAAT TTGGTG 2 7 00 

ATATTACTAA AACATATGTA GTATTAGTAG AAGGG CATT A CGACAATACA GGTAAGAACT 27 60 

5 TAAAAACTCA GGTTATTCAA GAAAATGTTG ATCCTGTAAC AAATAG AGAC TACAGTATTT 2 82 0 

TCGGTTGGAA TAATGAGAAT GTTGTACGTT ATGGTGGTGG AAGTGCTGAT GGTGATTCAG 2880 

CAGTAAATCC GAAAGACCCA ACTCCAGGGC CGCCGGTTGA CCCAGAACCA AGTCCAGACC 2 94 0 

w 

CAGAACCAGA ACCAACGCCA GATCCAGAAC CAAGTCCAGA CCCAGAACCG GAACCAAGCC 3 000 

CAGACCCGGA TCCGGATTCG GATTCAGACA GTGACTCAGG CTCAGACAGC GACTCAGGTT 30 GO 

CAGATAGCGA CTCAGAATCA GATAGCGATT CGGATTCAGA CAGTGATTCA GATTCAGACA 312 0 

15 

GCGACTCAGA ATCAGATAGC GACTCAGAAT CAGATAGTGA GTCAGATTCA GACAGTGACT 3180 

CGGACTCAGA CAGTGATTCA GACTCAGATA GCGATTCAGA CTCAGATAGC GATTCAGACT 324 0 

20 CAGACAGCGA TTCAGATTCA GACAGCGACT CAGATTCAGA CAGCGACTCA GACTCAGATA 3 3 00 

GCGACTCAGA CTCAGACAGC GACTCAGATT CAGATAGCGA TTCAGACTCA GACAGCGACT 33 6 0 

CAGACTCAGA CAGCGACTCA GACTCAGATA GCGACTCAGA TTCAGATAGC GATTCAGACT 342 0 

25 CAGACAGCGA CTCAGATTCA GATAGCGATT CGGACTCAGA CAGCGATTCA GATTCAGACA 3480 

GCGACTCAGA CTCGGATAGC GATTCAGATT CAGATAGCGA TTCGGATTCA GACAGTGATT 3 54 0 

CAGATTCAGA CAGCGACTCA GACT CGGATA GCGACTCAGA CTCAGACAGC GATTCAGACT 3 600 

30 

CAGATAGCGA CTCAGACTCG GATAGCGACT CGGATTCAGA TAGCGACTCA GACTCAGATA 3 660 

GTGACTCCGA TTCAAGAGTT ACACCACCAA ATAATGAACA GAAAGCACCA TCAAATCCTA 3 72 0 

AAGGTGAAGT AAACCATTCT AATAAGGTAT CAAAACAACA CAAAACTGAT GCTTTACCAG 3 780 

35 

AAACAGGAGA TAAGAGCGAA AACACAAATG CAACTTTATT TGGTGCAATG ATGG CATT AT 3 84 0 

TAGGATCATT ACTATTGTTT AGAAAACGCA AGCAAGATCA TAAAGAAAAA GCG TAAATAC 3 900 

40 TTTTTTAGGC CGAATACATT TGTATTCGGT TTTTTTGTTG AAAATGATTT TAAAGTGAAT 3 960 

TGATTAAG CG TAAAATGTTG ATAAAGTAGA ATTAGAAAGG GGTCATGACG TATGGCTTAT 4 020 

ATTTCATTAA ACTATCATTC ACCAACAATT GGTATGCATC AAAATTTGAC AGTCATTTTA 4 080 

45 CCGGAAGATC AAAGCTTCTT TAATAGCGAT ACAACTGTTA AACCATTAAA AACTTTAATG 414 0 

TTGTTACATG GATTATCAAG TGATGAAACG ACATATATGA GATATACAAG CATAGAAAGG 4 200 

TATGCGAATG AACACAAATT AGCTGTGATT ATGCCCAATG TGGAT CAT AG CGCATATGCT 4 2 60 

SO 

AACATGGCAT ATGGTCATAG CTATTATGAT TATATTTTGG AAGTGTATGA TTATGTTCAT 4 32 0 

CAAATATTTC CACTTTCCAA AAAGCGTGAT GACAATTTTA TAGCAGGTCA CTCTATGGGA 4 3 80 
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TTATCTGCTG TGTTTGAAGC GCAAAATTTA ATGGATCTAG AGTGGAATGA TTTTTCAAAA 4 5 00 

GAGGCCATAA TTGGCAATCT TTCAAGTGTT AAAGGAACTG AACATGATCC GTATTACTTG 4 5S0 

CTAGACAAAG CTGTAGCTGA AGATAAACAA ATTCCAAAAT TGCTCATTAT GTGTGGTAAA 462 0 

CAAGACTTTT TATAT CAAGA CAACTTAGAT TTTATCGATT ATTTATCACG CATAAATGTT 46 8 0 

CCTTATCAAT TTGAAGATGG ACCAGGAGAT CATGATTATG CATATTGGGA TCAAGCGATT 4 74 0 

AAGCGTGCTA TAACATGGAT GGTGAATGAT TAATTATTTC TTGGAAAATA TGTGGCTGCA 4 80 0 

TTAAATACAC AG AGTG AGAG ATACAAACTA TTTACGCACG ACTAACATTT CTAAGTGTTT 486 0 

AAATTATTTT TGTATTAATA TGATTGG CGC AATTTGCTGA TACACAAAAA TGTTTCTCGT 4 92 0 

GAAACTTAGA TTTAGCTTAT AGTTTTATCA TCATTTGTAT GACTTACATT ATAAATTTTA 4 98 0 

TTATAATGAG GTTAACG CTT TGAAAGGAGT CATCATCATG TCGACCAATA AAAACGATTA 504 0 

TGAGCATATG TTGTTTTATT TTGCATATAA AACCTTTATT ACTACCGCTG ATGAAATTAT 5100 

AGAGAAGTAT GGTATGAGTC GTCAGCATCA TC G TT TTTT G TTTTTTATCA ATAAATTACC 5160 

TGGTATTACT ATTAAATCAT TACTAGAAAT ATTAGAAATT TCTAAmCAAG GATCACATGC 522 0 

AACACTTCAA AAATTAAAAG AGCAAGGTCT CATTATTGAA AAAGTTTTAG AGACTGATCG 528 0 

ACGTGTCAAA AAATTATATT CGACGGATAA AGGCGATCAA CTCATTGCTG AATTGAACAA 534 0 

GGCGCAAGAT GAATTATTGC AAAATATATA TCAACAAGTC GGTTCGGATT GGTATGATGT 54 00 

GATGGAAGCA TTGG CTAAAG GgCGACCTGG cTTTGATTTT ATTAAGCATT TGAAAGATGA 54 6 0 

AAAAGAAAGC TAGCATCAGA AATGTTAAAA ATCTTCGCAT TCTTAAATTT AAAAAATATG 5 520 

TCAAAAAGTG TATAATAAAA ACATATAATT TAATTGAACT CAGTTTCAAC ACATCTTAGA 5 58 0 

AAGGAGTTTG AATGATGAAA AAATTAGCAG TTATTTTAAC ATTAGTTGGC GGTTTATACT 564 0 

TCGCATTTAA AAAATACCAA GAACGTGTTA ACCAAGCACC TAACATTGAG TACTAAATTA 570 0 

AACCATAAAA AATTCCCGAA CACCTTGTTA TAGTGCTCGG GAATTTTTTT ATGCTTTACT 5 76 0 

TGAATATATC AAATATTATT TTTGCGCTTT CTGTATTTTC GATATTACCA CTAAATGATT 582 0 

CTGATCTAGG TCCGTAAGCG TAgGTATTAA CATCCTCGCC TGTATGTCCA TCGGAAGTCC 5 8 80 

ACCCTGTATA AGATTTATCA TTTACTGGCT TCTGAATAGC GTGTTGTAGG GCTTTTGTTT 594 0 

GCGTTTCTAC TTCTGCGGAT TTTTCGTCTT TTTCTT T TTT AAGTAGTCTT TTTAGCTTTT 600 0 

TATTCTCTTT TTTAACCTTT TTCATATCAT CTTGTGAAAA TTCAAATCCA TAACCTTCAT 6 06 0 

TAATAACTTT TTCAGGGTCT TCACCTTTAG CCATTTTTTC TGTCATATAT GATCCAGAGT 6120 

GTTTCATAGA TTTAATCGGT TGAGGATTCC ATTCGTATCC TTTATCTTTA CCAATTGTTA 618 0 
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ATTGAATGGC GTCATCGAAT GCTTTTTCAA AACCTTCCAT TTCAGACATA ACGCCTGTAA 6 3 00 

TATCGTTGGA ATG CGCTG AT TTATCTATAG AAGCACCTTC GAC CATTAAA AAGAATCCTT 6360 

TTTTATTGCG CTCAAGCTTA CTAAGTGCAC TTTGTTGCAT ATCAGCTAAT GATGGTTCGT 64 20 

CTTTAGAAGC ATCTATTGCA AG TGG CATAT TTTTATCTGC AAACAAACCA AGAACTTTAT 64 80 

CTTTATCAGA TTTTGATAAC TCCTTACTGT TCGTGGCAAG GTCGTAACCA TCTTTTTTGA 6 54 0 

ATTTTTTATC TAAATTGCCA TTACTTTTAC CGAAATATTT AGCGCCGCCG CCTAATAAAA 66 00 

CATCAACTTT ATGCTTTCCG TTGATTTTAT CTTTATAAAA TTGTTTAGCG ATTTCGTTTT 66 6 0 

TATCATCTCT AGAAGTCACG TGTGCAGCAT ATGCTGCTGG TGTTG CATCT GTTAATTCAG 6 72 0 

CTGTTGAAAC AAGACCAGTC GACTTACCTT TTTCTTTTGC ACGTTCAAGC ACCGTCTTTA 6 78 0 

CTTTCTGCTT GTTACTGTCA ACACCGATGG CACCATTATA TGTCTTATGA CCAGAACTAA 684 0 

AGGCTGTTCC GCCAGCTGCA GAATCAGTAA TATTCTGTTT TGGGTCATTT GAATATGTAC 6 90 0 

GATTTGTGCC TTTTAAATAT GAATCAAAAG CAGTAGGGGT CATTTCTTTA GCATGCGGAT 6 96 0 

CATTTTTATA ATAACGATAA GCTGTGTTAA ATGATGGACC CATGC CAT CG CCAACTAAAA 7 02 0 

AGATAACATT TTTTGGATTT TTAGTATTAC CAACCGCGAA ACTTTCATCT TTAGAACTTT 7 08 0 

TATCGGATTG CGCAATTGCA GGTGTGACAG AACTAAAAAC CGTTGACACG ATAATAAGGT 714 0 

TAGCAACTGC AAATTTTGTG GCTTTTTTAA CTGATAACAT AAGACATCCT CCTGAGTATA 7200 

TGACTATGTC TTCAGTGTAA AAGAGGAATT T t G AGCAATT ATGTAGTTTT AGTTAnAAAT 726 0 

ATGTAAACAG AGTGATTTAG AATAACAAAA aATGAATATA TATGACAATT TGTTATAGAA 7 32 0 

AGCGTTAGAA TAG AAG CGTG TGAAAATATA GAATTAAATA TAATTTGAGG TGGAAAAATG 738 0 

ATACTAGTAA TGTTATCTCC ATTATTAATC ATATTCTTTA TAGTGTTGTC TATTTTAGAA 744 0 

GAGCGTAAAC GTACGAAGAA AAAGCAACTC GAGAAAGAAA AAGCAAATAC ACTAAATCAA 750 0 

AATACAAATG ACACGGAAAG TTCAAATCAA GAG CCGTCAT TGCAGCAGGA TAAAGAACAA 7 560 

AAAGATAACA AAGGATAATT CAATTGAAGG AAGAAGATTA TAGATGAAAA TATTAATTGT 7 62 0 

TGAAGATGAT TTTGTTATAG CAGAGAGTTT AGCATCTGAA CTTAAAAAAT GGAATTACGG 7 680 

TGTTATTGTC GTTGAACAAT TTGATGATAT ACTGTCT AT C TTTAACCAAA AT CAACCTCA 7 74 0 

GCTTGTATTG CTAGATATTA ATTTGCCAAC GTTAAATGGT TTTCATTGGT GTCAAGAAAT 7 800 

CCGAAAAACA TCTAATGTGC CAATTATATT TATTAGTTCC CGTATTGATA ATATGGACCA 78 60 

AATTATGGCA ATACAAATGG GGGGAGATGA TTTTATCGAA AAGCCATTTA ACTTGTCATT 7 92 0 

AACGATTGCC AAAATTCAAG CATTATTGAG ACGAACTTAT GACTTGTCAG TAGCTAATGA 7 980 
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ACAAAACATA CAGCTATCTT TGACTGAATT ACAAATATTA AAGTTATTAT TTCAAAATGA 810 0 

AGaTAAATAT GTAAGTAGrA CTGCTTTAAT T GaAAAATGT TGGGaATCAG AAAACtTCAT 8160 

AGATGATAAC A CATT AG CTG TTAACATGAC GCGCCTGCTG AAAAAATTAA ATACTATTGG 82 2 0 

CGTTAATGAT TTTATCATTA CAAAGAAAAA TGTCGGATAT AAAGTATAGG GTGAATGCAA 82 8 0 

TGACCTTTCT TAAAAGTATT ACTCAGGAAA TAGCAATAGT CAT AG TTATT TTTGCTTTGT 8 34 0 

TTGGCTTAAT GTTTTACCTG TATCATTTGC CATTAGAAGC ATATTTACTA GCACTTGGCG 84 0 0 

TTATTTTATT ATTATTACTC ATATTCATAG GTATTAAATA TTTAAGTTTT GTAAAAACTA 84 6 0 

TAAGCCAACA ACAACAAATT GAAAACTTAG AAAATGCGTT GTATCAGCTT AAAAATGAAC 8 52 0 

AAATTGAATA TAAAAATGAT GTAGAGAGCT ACTTTTTAAC ATGGGTACAT CAAATGAAAA 8 58 0 

CACCCATTAC TGCAG CACAA CTGTTACTTG AAAGAGATGA GCCTAATGTT GTTAATCGTG 864 0 

TTCGTCAAGA GGTTATTCAA ATTGaTAACT ATACAAGTTT AGCACTTAGT TATTTAAAGT 8700 

TATTAAATGA AACTTCTGaT ATTTCTGTCA CTAAAATTTC GATTAATAAT ATCATTCGCC 876 0 

CAATTATTAT GAAATATTCA ATACAGTTTA TTGATCAAAA AACAAAAATC CATTATGAAC 882 0 

CTTGTCATCA CGAAGTATTA ACTGACGTTA GATGGACCTC TTTAATGATA GAACAATTAA 88 8 0 

TAAATAATGC ACTTAAGTAT GCGAGAGGTA AAGATATATG GATTGAATTT GATGAGCAAT 8 94 0 

CCAATCAATT ACACGTAAAA GATAATGGTA TCGGTATTAG TGAAGCGrAC TTGCCTAAAA 900 0 

TATTTGATAA GGGCTATTCA GGTTATAATG GCCAGCGCCA AAGTAACTCA AGTGGGaTTG 90 6 0 

GTTTATTTAT CGTAAAACAA ATTTCAACAC ACACAAACCA TCCTGTTTCA GTCGTATCTA 912 0 

AACAAAATGA GGGTACAACA TTTACGATTC AATTTCCAGA TGAATAAAAA CTTT CAAT AT 918 0 

TGT AAG TATA CTAGTAACAT TTTT TTACTA ATTTAAATGT TATTAGTATT TTTTTGTTTT 924 0 

AATATAGAAC TAACAAAGAA ATGAGGTGCA TGCCATGTTG CTAGAAGTGn AACATGTAAA 93 0 0 

AAAGGTTTAT GGTAAAGGTT TGAATGCTAC GACAGCACTT AATCAAATGA ATTTATCAGT 936 0 

TGGAGCTGGT GaATTTGTTG CaATTATGGG TGAGTCTGGG tCAGGGAAGT CTACACTACT 94 2 0 

AAATTTAATT GCtTCTTTTG ATGGACTAAC TGAAGGTGAC ATTATTGTGG ATGGCGCACA 94 8 0 

TTTAAATAAT ATGAAAAATA AAAGTAAAGC ATTGTATCGT CaACAAATGG TAGGTTTTGT 954 0 

TTTT c AAG AT TTTAATCTTT TACCAACAAT GACGAATAAA GAAAATATAA TGATGCCATT 9600 

AATTTTAGCT GGTGCTAAAC GAAAAGATAT AGAACAAAGG GTACATCAGT TGGCAGTACA 96 6 0 

ATTACATTTA GAGGGATTCT TAAACAAGTA TCCTTCTGAA ATCTCTGGGG GTCAGAAGCA 9720 

ACGCATTGCC ATTGCACGTG CATTAGTTAC TAAGCCGACG ATTTTACTAG CCGATGAACC 97 8 0 
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TCAATTGGAA CAGACAATTT TAATGGTAAC TCATTCAAAT ATCGATGCGT CTTATGCAGA 9900 

GCGAGTCATT TTTATTAAAG ATGGGCGTCT ATATCATGAA AT ATAT CGTG GTGAAGAAAG 9 950 

TCAATTAGCT TTTCAACAAC GAATAACAGA TAGCTTAGCA CTTGTGAATG GAGGAAGTGT 10020 

CAATATATGA AGTTAAGATT GTTATGnACA TAGTGCGACG TCAATTTATT ACGCAGCGAC 10080 

TTGTAATCAT TCCATTCATT TTAGCGGTAA GTGTACTATT CATGATTGAA TATACGCTTG 1014 0 

TGTCAATTGG GTTAAATAGC TACATAAAAC AGAAGAATGA CTTCCTAGTA CCATTTATTA 10200 

TCATAGCTAA TTTTTTTATG GCGCTTTTAA CTTTTATTTT TATTTTCTAT GCAAATCACT 10260 

TTATGATGTC ACAAAGACGA AAAGAGTTTA GCA TTTTTA T GACATTGGGC ATGACCAAGA 103 2 0 

AAAGTATGCG TTTAATTGTA GTGATGGAAA CTATCTTACA ATTTGTGATA ATTT CAGTCG 103 8 0 

TTAGTATTGC CGGCGGATAC TTACTTGGTG CGATATTTTT CTTGTTTATA CAGAAAATAA 10440 

TGGGCAGTGA AGTTGCGACG TTAAGGTATT ATCCATTTGA CTCTGTAGCG ATGTTTATTA 10500 

CTTTGATTAT CATTGCTGTA TTAATGGGCA TGCTACTTAT ATTCAACTTG TTTAGTATTA 105 GO 

ATTTTCAACG GCCGATAACT TATCAACATC GTTCCGATTC TAGTGTCATA T CACGATGGT 106 2 0 

TGCGTTACGT TTTAATTGTT ATAGGAAGCG CAllACTATAT TTAGGTTACT TTATTGCATT 106 80 

ACAACAAGAT ACGACGTTTG GTGCCTTTTT TAAAATATGG ATTGTCATAG GATTAGTTAT 1074 0 

TATCGGTACT TATGCATTTT TTGTAGGTAT AAGTGAAATA ATTATTAGTA TATTGCAGCA 1080 0 

GGTATCAAAA GTTTACTATC ATCCACGGTA TTTTTTTGTG GTAGTTGGGA TGCGTGTACG 1086 0 

TCTTAAAATG AATGCAGTCA GTCTTGCAAC AAT CACTTTG CTGTGTACAT TTTTGATTGT 10920 

AACGCTCACA ATGACATTAA CAACCTATCG TGATATGAAT CATACCATTA CGAAATTGAT 10980 

TACGAATGAT TakGATTTGT CATTTAGCGA CAATTCTAAG TCACAAaTAG AACGTCAACA 11040 

AACAATTGAG 11050 
(2) INFORMATION FOR SEQ ID NO: 97: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9B3 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 97: 
CGACATAACG AGGCAAGGGT ACATGATACT TTAGCCTCGT TTTTGATATG TATTTTTCTG 
AATATAAGGG CAATAGATGG TATTTTATAw TTTTTTTAAG GTAGTGATTA ACATAGATAT 
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TCAAGCGGAA CAGCATTATG CACCAGTATT AACGCATTTT TTAGATC CAA GAGGGCAATA 24 0 

TATATTGGAA GTGATTTGTG G CAGTTATG A AGATTTAAAC GTATCTTTTT ATGGTGG AC C 3 00 

TAATGCTGAA AGAAAAAGAG CAATCATTTC GCCGAACTAT TATGAACCTA AAGAAAGCGA 36 0 

CTTTGAATTA ACTTTAATGG AAATAGATTA TCCTGAAAAA TTCGTCACTT TAAAACATCA 420 

ACATATTTTA GGGACATTAA TGTCTTTAGG TATCGAACGC GAACAAGTTG GAGATATAAT 4 80 

TGTGaATGAA CGAATTCAAT TTG TTTTGAC AAGTAGATTG GAATCATTTA TTATGTTAGA 54 0 

ATTACAACGT ATTAAAGGCG CATCAGTTAA ACTTTATACT ATTCCAGTAA CAGATATGAT 600 

ACAATCTAAT GAGAATTGGA AAAATGAAAG TGCaCAGTTA GTTCTTTAAG GTTAGATGTT 66 0 

GTTATTAAAG AAATGATACG TAAATCACGT ACGATTGCGA AACAACTAAT CGAAAAAAAA 720 

CGTGTTAAAG TGAATCACAC TATTGTTGAT TCAGCAGATT TTCAATTACA AGCAAATGAT 7 80 

TTAATATCCA TCCAAGGTTT TGGTAGAGCA CACATTACTG ACTTAGGTGG TAAAACTAAA 84 0 

AAAGATAAAA CGCACATTAC CTATAGAACA TTATTCAAAT AGTAATGATT TAAGGAGGAT 90 0 

AACAAATGCC TTTTACAC CA AATGAaATTA AGAATAAAGA GTTTTCACGT GTaAAGAATG 96 0 

GTTTTAGAAC CTACTGnAGT TGG 983 
(2) INFORMATION FOR SEQ ID NO: 98: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10322 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 98: 

TTTTGCAAAG CTTATTTTAT GTCAAACAGA TAGTCAATGT GAAACAAAGG TTAGTACATA 6 0 

TAATCATCCA GACTTTATGT ATATATCAAC AACTGAGAAT GCAATTAAGA AAGAACAAGT 12 0 

TGAACAACTT GTGCGTCATA TGAATCAACT TCCTATAGAA AG CACAAATA AAGTGTACAT 180 

CATTGAAGAC TTTGAAAAGT TAACTG TTCA AGGGGAAAAC AGTATCTTGA AATTTCTTGA 24 0 

AGAACCACCG GACAATACGA TTGCTATTTT ATTGTCTACA AAACCTGAGC AAATTTTAGA 3 00 

CACAATCCAT TCAAGGTGTC AGCATGTATA TTTCAAGCCT ATTGATAAAG AAAAGTTTAT 360 

AAATAGATTA GTTGAACAAA ACATGT CTAA GCCAGTAGCT GAAATGATTA GTACTTATAC 420 

TACGCAAATA GATAATGCAA TGGCTTTAAA TGAAGAATTT GATTTATTAG CATTAAGGAA 4 80 

ATCAGTTATA CGTTGGTGTG AATTGTTGCT TACTAATAAG CCAATGGCAC TTATAGGTAT 54 0 
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GAATGGTTTC TTCGAAGATA TCATACATAC AAAGGTAAAT GTAGAGGATA AACAAATATA 650 

TAGTGATTTA AAAAATGATA TTGATCAATA TGCGCAAAAG TTGTCGTTTA ATCAATTAAT 72 0 

T'lTGATGTTT GATCAACTGA CGGAAGCACA TAAGAAATTG AmTCAAAATG TAAATCCAAC 780 

GCTTGTATTT GAACAAATCG TAATTAAGGG TGTGAGTTAG ATGCCAAATG TAATAGGTGT 84 0 

TCAGTTTCAA AAAGCGGGAA AATTAGAATA TTATACACCT AATGATATAC AAGTAGATAT 90 0 

AGAAGACTGG GTAGTTGTCG AATCTAAAAG AGGCATAGAG ATAGGTATTG TTAAAAATCC 96 0 

ATTAATGGAT ATTG CTGAAG AGGATGTTGT GTTACCTCTT AAAAATATTA TTCGCATTGC 102 0 

TGATGACAAA GATATTGATA AATTTAATTG TAATGAACGA GATGCTGAAA ATG CATTAAT 108 0 

ACTATGTAAA GACATTGTAA GAGAACAAGG TTTGGACATG CGTTTAGTCA ATTGCGAATA 114 0 

TACATTAGAT AAATCGAAAG TTATTTTTAA TTTTACGGCG GATGATCGTA TTGATTTTAG 12 0 0 

AAAATTAGTA AAAATATTAG CGCAACATTT AAAAACACGT ATCGAGTTGA GACAAATTGG 126 0 

TGTAAGGGAT GAAGCCAAAT TGCTTGGCGG TATCGGACCT TGTGGTAGGT CGTTATGTTG 1320 

TTCTACATTT TTAGGGGATT TTGAACCAGT AT CG ATTAAG ATGGCTAAGG ATCAAAATTT 13 80 

ATCATTAAAT CCAACTAAAA TTT CTGGTGC ATGTGGTCGT TTGATGTGTT GTTTAAAATA 144 0 

TGAAAATGAC TATTATGAGG AAGTACGTGC ACAATTACCT GATATTGGTG AAGCAATTGA 150 0 

AACGCCTGAT GGTAACGGGA AAGTAGTTGC TTTAAATATA TTAGACATTT CTATGCAGGT 1560 

GAAG CTTG AG GGACATGAAC AGCCACTTGA ATATAAATTA GAAGAAATAG AAACTATGCA 162 0 

TTAAGGAGGC ATTATTACAT TTGGATCGCA ATGAAATATT TGAAAAAATA ATGCGTTTAG 1680 

AAATGAATGT CAATCAACTT TCAAAGGAAA CTTCAGAATT AAAGGCACTT GCAGTTGAAT 174 0 

TAGTAGAAGA AAATGTAGCG CTTCAACTTG AAAATGATAA TTTGAAAAAG GTGTTGGGCA 180 0 

ATGATGAACC AACTACTATT GATACTGCGA ATTCAAAACC AGCAAAAGCT GTGAAAAAGC 186 0 

CATTAC CAAG TAAAGATAAT TTGGCTATAT TGTATGGAGA AGGATTTCAT ATTTGTAAAG 1920 

GCGAATTATT TGGAAAACAT CGACATGGTG AAGATTGTCT GTTCTGTTTA GAAGTTTTAA 1980 

GTGATTAATC AAGCACACTC AAATAGTGTT ATAATTATAA ATGAATATGG TTTGGATAAG 2 04 0 

TCTGAGACAA TGCATGTTTC AGGCTTTAAT TGTGTATAAA GTTTTGG TGA TTGCATAAGA 2100 

GATGGCGGTA CTAAATGTTA TTATTAAGTG TGCACGCAgT ATCaTTAGTT ATAAAATGTA 216 0 

GCTGTTAAAA GTCAAAAATA CATCGAATGT AGTTAGGCAT ATAATATAAA AAGAGTTTTC 222 0 

AATTACTCAA TAGAAAAAGG TTGTCTTCAT AGGAGTTAAA AATGTTAAAA GAGAATGAAC 2280 

GATTTGATCA ACTAATCAAA GAAGATTTTA GTATTATTCA AAATGATGAT GTTTTTTCAT 234 0 
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TGGACTTATG TTCAGGCAAT GGGGTGATAC CCTTGTTATT GTTTGCGAAA CATCCACGAC 246 0 

ATATAGAAGG TGTTGAGATT CAAAAAACAC TTGTCGATAT GGCGCGACGC ACATTTCAAT 2 52 0 

TCAATGATGT TGATGAATAT TTAACAATGC ATCACATGGA TTTGAAAAAC GTTACTAAAG 2 580 

TATTTAAACC TT CACAATA T ACTTTAGTAA CGTGTAATCC GCCTTATTTT AAAGAGAATC 2 64 0 

AGCAACACCA ACATCAAAAA GAAGCACATA AGATAGCGAG ACATGAGATT ATGTGTACAC 2 700 

TTGAAGATTG CATGATTGCA GCCCGTCATT TATTAAAAGA AGGTGG CAGG CTAAACATGG 2760 

TACATCGTGC AGAGAGACTA ATGGATGTCT TGTTTGAAAT GAGAAAAGTG AATATTGAAC 2 820 

CTAAGAAAGT CGTTTTTATA TATAGTAAAG TAGGGAAATC AGCACAAACG ATAGTAGTAG 2 880 

AAGGTCGAAA AGGTGG AAAT CAAGG TTTAG AAATCATGCC CCCATTTTAT ATTTATAATG 2 94 0 

AAGATG GTAA TTATAGCGAA GAAATGAAGG AAGTATATTA TGGATAGTCA TTTTGTATAT 3 0 00 

ATTGTAAAAT GTAGTGATGG AAGTTTATAT ACAGGATACG CTAAAGACGT TAATGCACGT 3 060 

GTTGAAAAAC ATAACCGAGG TCAAGGAGCC AAATATACGA AAGTAAGACG TCCGGTGCAT 312 0 

TTAGTTTATC AAGAAATGTA TGAGA CAAAG TCTGAAGCAT TGAAGCGTGA ATATGAAATT 3180 

AAAACTTATA CCAGACAAAA GAAATTG CGA TTAATTAAGG AG CGATAGTA TGGCTGTATT 32 4 0 

ATATTTAGTG GGCACACCAA TTGGTAATTT AGCAGATATT ACTTATAGAG CAGTTGATGT 3 3 00 

ATTGAAACGT GTTGATATGA TTGCTTGTGA AGACACTAGA GTAACTAGTA AACTGTGTAA 3 360 

TCATTATGAT ATTCCAACTC CATTAAAGTC ATATCACGAA CATAACAAGG ATAAG CAGAC 3420 

TGCTTTTATC ATTGAACAGT TAGAATTAGG TCTTGACGTT GCGCTCGTAT CTGATGCTGG 34 8 0 

ATTGCCCTTA ATTAGTGATC CTGGATACGA ATTAGTAGTG GCAGCCaGAG AAG CTAATAT 3 54 0 

TAAAGTAGAG ACTGTGCCTG GACCTAATGC TGGGCTGACG GCTTTGATGG CTAGTGGATT 360 0 

ACCTTCATAT GTATATACAT TTTTAGGATT TTTGCCACGA AAAGAGAAAG AAAAAAGTGC 3 660 

TGTATTAGAG CAACGTATGC ATGAAAATAG CACATTAATT ATATACGAAT CACCGCATCG 3 72 0 

TGTGACAGAT ACATTAAAAA CAATTGCAAA GATAGATGCA ACACGACAAG TATCACTAGG 37 8 0 

GCGTGAATTA ACTAAGAAGT TCGAACAAAT TGTAACTGAT GATGTAACAC AATTACAAGC 3 84 0 

ATTGATTCAG CAAGG CGATG TACCATTGAA AGGCGAATTC GTTATCTTAA TTGAAGGTGC 3 900 

TAAAGCGAAC AATGAGATAT CGTGGTTTGA TGATTTATCT AT CAATGAG C ATGTTGATCA 3960 

TTATATTCAA ACTTCACAGA TGAAACCAAA ACAAGCTATT AAAAAAGTTG CTGAAGAACG 4020 

ACAACTTAAA ACGAATGAAG TATATAATAT TTAT CATCAA ATAAGTTAAT CACTTTATCG 4 080 

ATTaTATGAA ATTTTAAACG ATTTTATAAA CGCAAGCTGT AATTTTAAAT GGTAAGTTAT 414 0 
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GTTTTTTAAT GXAAAATAAA TACATTGAAA GTAATAAATA CCTTAACATT GAATAAGATG 426 0 

AAAATGAGAT GACGAGATAA ATGTTCGCGT CCGTTGAAAT GCATAGAAAT CTTAGATATT 4320 

ATTTGAAGTG AGACATTACG AGGAGGAACA GTTATGGCTA AAGAAACATT TTATATAACA 4 380 

ACCCCAATAT ACTATCCTAG TGGGAATTTA CATATAGGAC ATGCATATTC TACAGTGGCT 444 0 

GGAGATGTTA TTGCAAGATA TAAGAGAATG CAAGGATATG ATGTTCGCTA TTTGACTGGA 4 5 00 

ACGGATGAAC ACGGTCAAAA AATTCAAGAA AAAGCTCAAA AAGCTGGTAA GACAGAAATT 4 560 

GAATATTTGG ATGAGATGAT TGCTGGAATT AAACAATTGT GGGCTAAGCT TGAAATTT C A 4 62 0 

AATGATGATT TTATCAGAAC AACTGAAGAA CGTCATAAAC ATGTCGTTGA GCAAGTGTTT 4 680 

GAACGTTTAT TAAAGCAAGG TGATATCTAT TTAGGTGAAT ATGAAGGTTG GTATTCTGTT 4 74 0 

CCGGATGAAA CATACTATAC AGAGTCACAA TTAGTAGACC CACAATACGA AAACGGTAAA 4 800 

ATTATTGGTG GCAAAAGTCC AGATTCTGGA CACGAAGTTG AACTAGTTAA AGAAGAAAGT 4 86 0 

TATTTCTTTA ATATTAGTAA ATATACAGAC CGTTTATTAG AGTTCTATGA CCAAAATCCA 4 92 0 

GATTTTATAC AACCACCATC AAGAAAAAAT GAAATGATTA ACAACTTCAT TAAACCAGGA 4980 

CTTGCTGATT TAGCTGTTTC TCGTACATCA TTTAACTGGG GTGTCCATGT TCCGTCTAAT 504 0 

CCAAAACATG TTGTTTATGT TTGGATTGAT GCGTTAGTTA ACTATATTTC AGCATTAGGC 510 0 

TATTTATCAG ATGATGAGTC ACTATTTAAC AAATACTGGC CAGCAGATAT TCATTTAATG 516 0 

GCTAAGGAAA TTGTGCGATT CCACTCAATT ATTTGGCCTA TTTTATTGAT GGCATTAGAC 522 0 

TTACCGTTAC CTAAAAAAGT CTTTG CACAT GGTTGGATTT TGATGAAAGA TGGAAAAATG 52 8 0 

AGTAAATCTA AAGGTAATGT CGTAGACCCT AATATTTTAA TTGATCGCTA TGGTTTAGAT 534 0 

GCTACACGTT ATTATCTAAT GCGTGAATTA CCATTTGGTT CAGATGGCGT ATTTACACCT 54 00 

GAAGCATTTG TTGAGCGTAC AAATTTCGAT CTAGCAAATG ACTTAGGTAA CTTAGTAAA C 54 60 

CGTACGATTT CTATGGTTAA TAAGTACTTT GATGGCGAAT TACCAGCGTA TCAAGGTCCA 5520 

CTTCATGAAT TAGATGAAGA AATGGAAGCT AT GGCTTTAG AAACAGTGAA AAGCTACACT 5580 

GAAAGCATGG AAAGTTTGCA ATTTTCTGTG GCATTATCTA CGGTATGGAA GTTTATTAGT 564 0 

AGAACGAATA AGTATATTGA CGAAACAACG CCTTGGGTAT TAGCTAAGGA CGATAGCCAA 5700 

AAAGATATGT TAGGCAATGT AATGGCTCAC TTAGTTGAAA AT ATT CGTTA TGCAGCTGTA 5760 

TTATTACGTC CATTCTTAAC ACATGCGCCG AAAGAGATTT TTGAACAATT GAACATTAAC 5820 

AATCCTCAAT TTATGGAATT TAGTAGTTTA GAGCAATATG GTGTGCTTAA TGAGTCAATT 5880 

AT GGTTACTG GGCAAC CTAA ACCTATTTTC CCAAGATTGG ATAGCGAcGG AnAATTGCAT 5940 
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AACCTCAAAT TGATATTAAA GACTTTGATA AAGTTGAAAT TAAGGCAGCA ACGATTATTG 60 60 

ATGCTGAACA TGTTAAGAAG TCAGATAAGC TTTTAAAAAT TCAAGTAGAC TTAGATTCTG 6120 

AACAAAGACA AATTGTATCA GGAATTGCCA AATT CTATAC ACCAGATGAT ATTATTGGTA 6180 

AAAAAGTAGC AGTTGTTACT AACCTGAAAC CAGCTAAATT AATGGGACAA AAATCTGAAG 624 0 

GTATGATATT ATCTGCTGAA AAAGATGGTG TATTAACCTT AGTAAGTTTA CCAAGTG CAA 6 3 00 

TTCCAAATGG TGCAGTGATT AAATAACTGT ATTTTTAAAA ATTAGGAGAG ATAATTATGT 6 36 0 

TAATCGATAC ACATGTC CAT TTAAATGATG AGCAATACGA TGATGATTTG AGTGAAGTGA 6420 

TTACACGTGc TAGAGAAGCA GGTGTTGATC GTATGTTTGT AGTTGGTTTT AACAAATCGA 64 8 0 

CAATTGAACG CG CGATG AAA TTAATCGATG AGTATGATTT TTTATATGGC ATTATCGGTT 6 54 0 

GGCATCCAGT TGACGCAATT GATTTTACAG AAGAACACTT GG AATGGATT GAATCTTTAG 66 0 0 

CTCAGCATCC AAAAGTGATT GGTATTGGTG AAATGGGATT AGATTATCAC TGGGATAAAT 6 660 

CTCCTGCAGA TGTTCAAAAG GAAGTTTTTA GAAAGCAAAT TGCTTTAGCT AAGCGTTTGA 6 72 0 

AGTTACCAAT TATCATTCAT AACCGTGAAG CAACTCAAGA CTGTATCGAT ATCTTATTGG 678 0 

AGGAGCATGC TGAAGAGGTA GGCGGGATTA TGCATAGCTT TAGTGGTTCT CCAGAAATTG 6 84 0 

CAGATATTGT AACTAATAAG CTGAATTTTT ATATTTCATT AGGTGGACCT GTGACATTTA 69 0 0 

AAAATGCTAA ACAGCCTAAA GAAGTTGCTA AGCATGTGTC AATGGAGCGT TTGCTAGTTG 696 0 

AAACCGATGC ACCGTATCTT TCGCCACATC CGTATAGAGG GAAGCGAAAT GAACCGGCGA 702 0 

GAGTAACTTT AGTAG CTGAA CAAATTGCTG AATTAAAAGG CTTATCTTAT GAAGAAGTGT 708 0 

GCGAACAAAC AACTAAAAAT G CAGAGAAAT TGTTTAATTT AAATTCATAA AGTTAAAAGT 714 0 

GAGAAAGATC ACCGC CATAA ATGTAAACGA TGCTATATTC GTTTAATATG CTATGGTTCT 7200 

TTCTCACTTT TTTAAATTAA AATATCGTGC ATGTGGAATA CGTGCGATAG AGATGGTTAG 7260 

AGCTTTGAAA TTAAGAATTG TAGGAAGGCG TTTTAAATGA AAATCAATGA GTTTATAGTT 73 20 

GTAGAAGGAC GAGATGATAC TGAGCGTGTT AAACGAGCTG TTGAATGTGA TACGATTGAA 738 0 

ACGAATGGTA GTGCCATCAA CGAACAAACT TTAGAAGTAA TTAGAAATGC TCAACAAAGT 7440 

CGAGGCGTTA TTGTATTAAC AGATCCAGAT TTCCCAGGAG ATAAAATTAG AAGTA CAATT 75 00 

ACTGAACATG TCAAAGGTGT TAAACATGCG TATATTGATA GAGAAAAAGC TAAAAATAAA 7560 

AAAGGGAAAA TTGGTGTTGA ACATGCCGAC TTAATTGATA TTAAAGAAGC GTTAATGCAT 7620 

GTTAGTTCAC CCTTTGATGA AGCTTATGAA TCAATTGATA AATCTGTGCT AATAGAGTTG 7680 

GGGTTAATTG TTGGGAAAGA TGCAAGGCGC CGTAGAGAAA TTTTAAGTAG AAAATTGCGA 7740 
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GCGGATGTAA GGCAAGCTTT AGAAGATGAA TGAGGAAGTG AAAATGTTGG ATAATAAAGA 7 86 0 

TATTGCAACA CCATCAAGAA CGCGAGCGTT GTTAGATAAA TATGGCTTTA ATTTTAAAAA 7 920 

AAGTTTAGGA CAGAACTTTT TGATAGATGT GAATATCATT AATAATATCA TTGATG CAAG 7980 

TGATATTGAT GCACAAACTG GGGTGATTGA AATTGGTCCA GGCATGGGGT CATTGACAGA 8 040 

ACAATTGGCC AGACATGCTA AAAGAGTATT GGCATTTGAA ATTGATCAAC GTTTAATACC 8100 

TGTATTAAAT GATACACTAT CACCTTATGA TAATGTGACG GTGATTAATG AAGATATTTT 8160 

AAAAGCGAAT ATTAAAGAAG CTGTTGAAAA TCATTTACAA GATTGTGAAA AAATAATGGT 8220 

TGTTGCAAAC CTGCCGTACT ATATTACGAC GCCAATTTTA TTAAATTTGA TGCAACAAGA 8280 

TATACCAATT GATGG CTACG TGGTGATGAT GCAAAAAGAA GTGGGCGAAC GCTTAAATGC 834 0 

TGAAGTAGGT TCAAAAGCAT ATGGTTCGTT ATCAATTGTC GTACAATACT ATACAGAGAC 84 00 

TAGTAAAGTA TTAACGGTAC CTAAATCTGT ATTTATGCCA CCACCTAATG TTGATTCAAT 84 60 

AGTTGTAAAA CTGATGCAGA GAACTGAACC GTTAGTAACA GTAGATAACG AGGAAGCATT 8 52 0 

CTTTAAGTTA GCAAAAGCAG CATTTGCACA AAGAAGAAAG ACAATTAACA ATAACTATCA 8 580 

AAATTATTTT AAAGATGGTA AACAACACAA AGAAGTGATT TTACAATGGT TGGAACAAGC 864 0 

AGGTATTGAT CCAAGACGTC GCGGTGAAAC GCTATCTATT CAAGATTTTG CTAAATTGTA 8 700 

TGAAGAAAAG AAAAAATTCC CTCAATTAGA AAATTAAATG ATTGACAAAG CAAAGCACTA 8 76 0 

TTGTTAAAAT TTAAATTTTG TTTGACGAAA ACGTTGCAAA TATGGTATTA TGTAACTTGT 8 820 

AGCGAGGTGG AGCAATATGC CAAAATCAAT TTTGGACATC AAAAATTCTA TTGATTGTCA 88 80 

TGTAGGAAAT CGTATTGTAC TGAAa GCCAA TGGAGGCCGT AAGAaAACAA TAAAACGTTC 8 94 0 

TGGAATTTTA AAAGAAACAT ATCCGTCAGT TTTCATTGTT GAGTTAGATC AAGACAAACA 90 0 0 

CAAC.TTTGAG AGAGTATCTT ATACATACAC TGATGTGTTA ACTGaAAATG TTCAAGTTTC 90 60 

ATTTGAAGAG GATAATCATC ACGAATCAAT TGCACACTAA ATAAGACATA TAGAGATGTT 9120 

AGACGTTTCT TAGTATAAGA AGTAAATATT ATGATAATTA TTTGAGTGTT GGGcATTATG 9180 

TTCAATACTC TTTTTATTTA CAAAATGTTT AACACTGATG TTTCGCTTAT AGATTTTTCA 9240 

GTAAATGGAT AATTGTATTT ATAAACACAA ATACAAGTAA ATACTAAGTA ATTAGATGGA 93 0 0 

GAAAATTACT TTTTTATTAA AAAAACACTA AAAAACAAAT TAAAATGTCA AATATTAATT 93 6 0 

CTCTTTATGT TAAAATCATC ATATTAAGAT AACGAAAAGA GGGCGGAAAA TGATATATGA 94 2 0 

AACGGCACCA GCCAAAATTA ATTTTACGCT CGATACACTT TTTAAAAGAA ATGATGGCTA 94 80 

TCATGAGATT GAAATGATAA TGACAACAGT TGATTTAAAT GATCGTTTAA CTTTTCATAA 954 0 
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AAATCTCGCA TATCGTGCAG CGCAACTATT TATTGAGCAA TATCAACTAA AGCAAGGTGT 96 60 

AACAATTTCT ATCGATAAAG AAATACCTGT TTCTGCTGGC TTAG CTGG AG GTTCGGCTGA 9720 

5 

TGCAGCAGCA ACGTTAAGAG GATTGAATCG ACTTTTTGAT ATAGGGGCGA GTTTGGAAGA 97 8 0 

ATTGGCTCTA CTAGGCAGTA AAAT CGGG AC AGATATTCCG TTTTGTATTT ATAATAAAAC 9 84 0 

^ TGCACTATGT A CTGG AAGAG GAGAGAAAAT CGAG TTTTT A AATAAACCAC CTTCAGCTTG 990 0 

GGTGATTCTT GCTAAACCAA ACTTAGGCAT ATCATCACCA GATATATTTA AGTTGATTAA 996 0 

TTTAGATAAG CGTTACGACG TACATAC GAA AATGTGTTAT GAGGCCTTAG AAAATCGAGA 1002 0 

rs TTATCAACAA TTATGTCAAA GTTTGTCTAA TCGATTAGAG CCAATTTCTG TTTCAAAACA 1008 0 

CCCACAAATC GATAAATTAA AAAATAATAT GTTGAAAAGT GGTG CAGATG GTGCGTTAAT 1014 0 

GAGTGGAAGC GGACCTACTG TGTATGGGCT AGCACGAAAA GAAAGCCAAG CAAAAAATAT 10200 

20 TTATAATGCA GTTAACGGTT GTTGTAATGA AGTGTACTTA GTTAGACTAT TAGGATAGAA 10260 

GGGTTGAAAA GATGAGATAT AAACGAAGCG AGAGAATTGT TTTTATGACG CAATATTTGA 10320 

TG 10322 

25 

(2) INFORMATION FOR SEQ ID NO : 99: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 5614 base pairs 

(B) TYPE : nucleic acid 
30 (C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 99: 

GATTGATTAA ATGTTTTAAT CCACTTCAAT GCCTTCGATA AACTCTACAA TCGCGCTATT 60 

CATATAATTA TTCGATTTCA TTTGTTCAGC ATATGTCTCA TTAAATCCAG ACATAACTTT 12 0 

TTTAAAwGCG AAAATTGAAA TTGGTATCGT TACTAATAAG GCACTAGCCA TACGCCAATC 180 

AATGAGCATT ATGTATAAAA AGATAGCAGC TGACAAAAGT AAGTTTCCTA TAACTTCAGG 24 0 

AATCATATGT GCTAAAGGTA ATTCTATTGT TTCAACCTTA TCGACAAATA TATTTTTTAA 3 00 

TTCACCTATT TTCTTAGATT CCaCTACGCC TAAAGGGAGA CGCATTAATT TTTGAG CTAA 3 60 

TTTTTTACGA ATTTCAGATA AAATTT C ATA TGCCGTAATA TGTGATAGCA TCGTTGACGC 42 0 

TCCAAAACAA CACACTTGTG AAATATAAGC GATTAAAGCA ATAAAGATAT AAACCATAAT 4 80 

CGAATTAATC GTATATGTAT TGTTAATCAT CATTAAAATA ATTTTAAATA CTG CCCAATA 54 0 

AGGAACTAAT CCAGAAAAGA CACTGATGAT AGACAACAAA ATTGATAACA TAATTTTCCA 600 
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ATATGTAACT CCTkTCAATT AATAATCTAA ATTAAGCCGC TTATATTATT TATTTCACTG 720 

GATGATATAC ATAATATAAA TTTGTTATTT GTTAAAAATT AATACTTATT ACAAGTACAT 780 

CATATATTAG TTGATAACGA TTATCAATGT CGCGTGGATT TGTGACACAT TTCTTTTAAA 84 0 

AATTCACAAG GTTATGGGGC AGAAATGATA AAGAGCCACT AATGATTTAT TATGTAGTGG 90 0 

TTCTGGGAGT GGGACAGAAA TGATATTTTC ACAAAATTTA TTTCGTCGTC CCACCCCAAC 96 0 

TTGCATTGTC TCTAGAAATT GGGAATCCAA TTTCTCTTTG TTGGGTCCCT GAATATAGCC 102 0 

TTGTAGAGTC TAGTACATTG ATTTGTATCC CAATGTCCCT ATAATTGATT ATTCGCTTTA 1080 

TCTAATGATC CTATGACTCA ACTATTAAAT CATTTTTCGA AATACTTAAT TCTAATATAA 114 0 

TTAAATTCAT TTATTGTAAT ATTGCAAAAA TACATTGCAC ACCTTGTTCA TCAATGCTAT 12 0 0 

AATTAATTAC ATAATAAATT GAACAT CTAA ATACACCAAA TCCCCTCACT ACTGCCATAG 12 60 

TGAGGGGATT TATTTAGGTG TTGGTTATTT GTCACCTTTT TTATTGTTG C GCGTTCGTAA 13 2 0 

CCAATGTGCA AAAAACGCAA CAAGACAGCC GCTTATAGCT GAAGTCATGA TGTTAATTAA 13 8 0 

TAAATTGAAC ATCCGTCATA CACCTCCTCT CTGCGTTAAA GTAACGCCCG AGATGTTAGG 144 0 

CGACCATCAT ATTATATCAT TTATTTATTA TATTTCACGC AATATTAAGG CTTAAGTAAA 150 0 

GTTTTTTTTA GTGGTTTACG CTACTTTAAT TGCTATCTTT TAAAATCCAT TTAGATAATA 156 0 

TAAATGTGAT GGGTATCGTA ATAATTAAAC CAGCAAATGG TGCAATTTCT GCTGGCAAAT 162 0 

TTAGCCAGGA TACAAATACA TATAATAAAA CTGTTTGTAA GCTTACGTTG ACAATCTGCG 168 0 

TAATTGGAAA ACTAATGAAT TTTCTCCAAG TAGGTTTTAC CCTGTAAACA AAATAACAAT 174 0 

TCAAATAATA TGAAATCACA AAAGCGACTA GAAATCCGGT AATATGACTA ATCATATATT 1B0O 

CAATGTGTAA TAATTTTAAC AG CAAT AAAT AGACAACATA ATAATTTAAC GTATTAATGC 186 0 

CGCCAACAAT GATAAATTTT AAAATTTCAG CATGCGTTTG TGTTAGTTTC ATATGTGTAc 192 0 

TCCTCAACAT CAAAATATAT GCATAACTAC GTTCTCGAAC ATACTCGAAT ATGCGAGCCA 1980 

ATCCGCTTCA CTTCAAATAT GCTTATTTCA ATCTTTATAC C CTTTCACAG CAAATTTAGT 204 0 

CTCTTTCCCC TCATCCTTAT ACGCCATTAT AATGTAACTG ATTTAT CGCG TGAC TCATTA 2100 

GCACTATAGA GATTACTTTA GTTCACTAGT AATTTTATAT ACAATAAGAG CGACAACAGT 216 0 

AATGAGAGGA TGTCTACTAT GCAATTACAA AAAATTGTCA TCGCTCCTGA CTCATTTAAG 222 0 

GAAAGTATGA CCGCACAGCA AGTTGGCAAT ATTATAAAAC AGGCTTTTAC TAATGTTTAT 22 80 

GGGAATACCC TTCATTATGA TATCATTCCG ATGGCTGATG GTGGTGAAGG TACCACAGAT 234 0 

GCTTTAATGC ATG CAACAGG TGCCACTAAG TATACAGTCA TCGTTAATGA CCCTTTAATG 24 00 
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GCGGCAGCGT CAGGTTTGGA TTTATTAGAA AAAGAGGAAC GTAATCCTTT ATACACATCA 2 520 

TCATATGGTA CCGGTGAACT AATTAAAGAT GCATTAAATC ATGGTGCTAA GACCATTATT 2 5 80 

TTAGGGATTG GTGGCAGTGC AACAAATGAT GGTGGTACAG GTATGCTAAG TGCACTAGGC 264 0 

GTAAAGTTTA CTGATGTAAA CGGGGACTTA TTACAAATGA ATGGTGCTAA TCTTGCTCAC 2 7 00 

ATTGCACAAA TCGATATAAC CAATCTAGAT TCGCGATTAA AAGAGGTGAC CTTTAAAGTG 276 0 

GCCTGTGATG TTTCAAATCC TTTATTGGGT GAAAATGGTG CTACCTATAT TTATGGTCCT 2 82 0 

CAAAAAGGCG CTGATGCAAA GATGATACCA AAGTTGGATT TCGCAATGTC G CATTAT CAT 288 0 

GATAAGATAA AAATGTGCAC AGGAAAGTCC GTTAATCAAA TAC CAGGTTC TGGTGCAGCT 294 0 

GGCGGTATGG GCGCAGCATT ATT AG CGTTT TGTGAGACAA CTTTAACAAA AGGTATTGAT 3 000 

GTCGTCTTTG ACATTACAGA TTTTCATCAA AGAATTAAAG ATGCAGACCT CGTTATTACT 3 06 0 

GGAGAAGGAC GCATGGATTA TCAGACCATC TTTGGTAAAA CACCCGTAGG CGTTGCGTTA 312 0 

GCTGCAAAAC AATATCATAT TCCTGTCATC GCGATTTGTG GCAGTCTAGG CGAAAATTAT 3180 

CAACATGTTT ACGATTTCGG TATTGATAGT GCCTATTCTA TAATCTCTTC ACCTAGCACT 324 0 

TTAGAAGATG TCCTACAAAA TAG C GAACAA AATTTATTAA ACACTGCAAC TGACATTGCT 3 3 00 

CGTATTCTGA AATTACAATA ATGTCAAAGT AAATCATCAG CTTTATTATT TGCAGTTAAA 336 0 

AC TTG AATGA GGTGAAACCC ATGAAAAGAA CTGATAAATA CCGTGATTCA TATCAATACG 342 0 

ACAATCAAAA C CAAAAT CAT CGTCGTCAAT CTGAAGACGC ATCGTATAGA CAACAATATG 34 8 0 

CTAAAGGCGA TCCTGAAGAA CACCCGGAAC GATACTATAA TGGTAGAGAT TATCGAAGAG 354 0 

AACAAATTCT TGAAGAAGAA AACGAGAAAT CCCGCCGTTC AAAAAAATGG TTATATATCA 3 60 0 

TTATTGCCAT TCTCTTAATT ATTGTCGCTA TTTTTGTCAC ACGCGCCTTA CTTAACAATG 3 66 0 

ATAGTGATAA AGTTAGTAAT GACCCTAAAG TCTCTCAAAA TTATAAAAAA CAAGTTGAAA 3 720 

ATCAAGACGG CCAAATTAAC CAGCAAGTAG ATAATGCTAA AGAAAATATT AAAAACAACC 3 7 80 

AAAAAACTGA TGACATTATT AAAAATTTAC AAAATCAAAT CGACAACTTG AAGCAGCAAG 3 84 0 

AACAAAACAA AGCTGATTCT AAGCTAACTC AATTTTATCA AG AC CAAATC AACAAATTGA 3 90 0 

CAGAGGCAAA TAATGCACTT AAAAACAATG CAAGCCAAGG TAAAATTGAA AGCATGTTAA 3960 

ATGATATTAA TACAAAATTC GACAGTATTA AAT CTAAATT AGAAAGCTTA TTTAAAGATG 4 020 

ACAATGGTGG CGCTAATTAA TTATTACACC TGCTTTGATG ATAAACATTA ATTCCCTATA 40 8 0 

CTTTATCTGT ATCACTACGT TATTCGTGAT GATGCATTAA GAGTATAGGG ATTTTTTATA 4140 

TAAACTTGTA TTCTAACTAC ATACAAATAC ACACAAAACG TATATAATTT ATATAATTAT 42 0 0 
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TTATTG CTAA 


TTACGTTAGG 


CGTCATGACC 


GCTTTTGGCC 


CACTAACTAT 


AGATATGTAC 


4320 






TACCTAAAGT 


GCAAGGTGAT 


TTTGGTTCTA 


CTACATCAGA 


AATTCAATTA 


4380 






TCACAATGAT 


TGGTCTTG CA 


CTAGGCCAAT 


TTATCTTTGG 


ACCTTTATCC 


4440 






GTCGCAAACG 


GATTGCTGTA 


TCCATTTTGA 


TCATTTTCAT 


TTTGGTAT CA 


4500 






TGTTTGTTGA 


TCAATTG CCA 


TTATTCTTAA 


CTTTACGATT 


TATTCAAGGT 


4560 


to 


TTAACTGGTG 


GTGGCGTCAT 


CGTGATTGCA 


AAAGCCTCTG 


CTGGTGATAA 


ATTTAGTGGC 


4620 




AACGCACTCG 


CTAAATTTTT 


AG CATCTTTA 


ATGGTAGTTA 


ATGGCATCAT 


CACT ATT CTT 


4680 


IS 


GCACCATTAG 


CCGGTGGATT 


AGCTTTATCC 


GTAGCAACAT 


GGCGTTCTAT 


TTTCACAATT 


4740 


TTAACTATTG 


TGG CACT CAT 


CATTTTAATT 


GGCGTCGCTT 


CTCAATTACC 


TAAAACATCT 


4800 




AAAGATGAAT 


TAAAGCAGGT 


GAATTTTAGT 


AGCGTCATTA 


AAGATTTTGG 


AAGTCTTTTG 


4860 


20 


AAAAAACCAG 


CATTTATTAT 


TCCAATGCTA 


TTACAAGG wT 


TAACTTATGT 


AATGCTATTT 


4920 




AGTTATTCAT 


CTGCATCGCC 


ATTTATTACT 


CAAAAATTGT 


ATAATATGAC 


ACCCCAACAA 


4980 




TTTAGTATCA 


TGTTTGCTGT 


TAACGGTGTA 


GGTTTAATCA 


TTGTCAGTCA 


AGTCGTTGCT 


5040 




TTATTAGTAG 


AAAAATTACA 


TCGCCACATA 


TTATTAATCA 


TTTTAACTAT 


TATACAAGTG 


5100 




GTAGGTGTTG 


CTTTAATTAT 


CCTGACACTT 


ACATTCCATT 


TACCACTTTG 


GGTCTTACTC 


5160 




ATCGCATTCT 


TCTTAAATGT 


GTGTCCTGTG 


ACGTCAATTG 


GACCGCTTGG 


TTTCACAATG 


5220 


30 


GCTATGGAAG 


AACGAACAGG 


TGGCAGTGGT 


AACGCATCAA 


GTTTACTTGG 


CTTATTC CAA 


5280 




TTTATCTTAG 


GTGGCG CTGT 


TGCACCATTA 


GTTGG CTTAA 


AAGGCGAATT 


TAATACATCA 


5340 


35 


C CATATATGA 


TTATTAT CTT 


CATTACAGCC 


ATTCTATTAG 


TCAGTCTACA 


AATCATTTAC 


5400 


TTTAAAATGA 


TTAAAAAGCA 


ACATGTCGCA 


TAACACTTCA ACATAATTAG 


AACCCTAGCA 


5460 




AAGATATCTA 


TCTTTGTCAG 


GGTTCTTCTT 


TATGAATTAT 


GAGATCGAAT 


CTTCAACTAA 


5520 


40 


AATTACGCCT 


TCATAGCAAG 


GACATTTCTA 


TTCAATCAC C 


CTTTAACAGG 


CATCCAAATT 


5580 




TcTGTAATAT 


ATTTTTCACT 


TGTAGTATCA 


CCAT 






5614 




(2) INFORMATION FOR SEQ ID NO: 100: 









45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9179 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 100: 



55 
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AAAGACAATG ATATGAAGTA TATGGATATC ACAGAaAAAG TGCCAATGTC GGAATCTGAA 12 0 

GTTAACCAAT TGCTAAAAGG TAAGGGGATT TTAGAAAATC GAGGGAAAGT TTTTCTAGAA 18 0 

GCTCAAGAAA AATATGAGGT TAATGTCATT TATCTTGTTA GCCATGCATT AGTAGAAACA 24 0 

GGTAACGGCA AAT CAG AATT AGCAAAAGGC ATTAAAGATG GGAAAAAACG CTATTACAAC 30 0 

TTTTTTGGTA TAGGAGCATT CGATAGTAGT GCTGTTCGTA GTGGGAAAAG TTATG CTGAA 360 

AAGGAACAAT GGACATCACC AGATAAGGCG ATTATTGGTG GTGCAAAGTT CATTCGTAAT 42 0 

GAATATTTTG AAAACAATCA ACTGAATTTA TATCAAATGC GATGGAATCC AGAAAATCCT 4 80 

GCGCAACATC AATATGCGAG TGACATTCGC TGGGCAGATA AAATTGCCAA ATTAATGGAT 54 0 

AAATCCTATA AGCAGTTTGG TATAAAGAAA GATGATATTA GACAAACATA TTATAAATAA GOO 

GACATCGGTG CTTAAAGGAG CTGGAACAAT TTATTGTTTC GAGCTCCTTT AGCGCATTCT 660 

GAGTGTGTTA GTTAAATGGA TTTTAACCTA ACAAAAAACG CTATATAGCA TCAAATATGC 720 

TATATCCCAC ATCATTGTTA CAAATGTACA TGATGTAAAT GAATATTGCT GTCTAAATGT 780 

GCATGTAATA TACAATGGTG CAGATAATAC ACTTAAGTCC TTAAAAATGA AACGTTAgTT 84 0 

CCAAGAGTCA TTTTTAAACA ATAGTGCATG TGATAAAATA GAAAAGAATG AAAAATATAG 900 

AGGTGACAAT ATGAAGATAG CAATTATAGG TGCAGGCATC GGTGGATTAA CAGCTGCTGC 960 

ATTATTACAA GAACAAGGTC ATACTATTAA AGTCTTTGAA AAAAATGAGT CAGTTAAAGA 1020 

AATTGGCGCT GGGATTGGTA TCGGAGATAA TGTGCTTAAA AAACTAGGTA ATCATGACTT 10 80 

AGCTAAAGGT ATTAAAAATG CTGGGCAAAT CTTATCTACA ATGACAGTGT TAGATGACAA 114 0 

AGATCGCCTG TTAACTACTG TTAAATTAAA AAGTAATACA TTGAATGTGA CGTTACCACG 12 0 0 

CCAAACATTA ATTGACATTA TTAAAT CTTA TGTAAAAGAT GACGCAATAT TTACAAATCA 12 60 

TGAAGTCACG CATATAGATA ATGAGACAGA TAAAGTTACC ATACATTTCG CGGAACAAGA 13 2 0 

AAGTGAAGCA TTTGATTTAT GTATTGGTGC TGATGGAATT CATTCTAAAG TGAGACAATC 13 8 0 

TGTAAATGCT GACAGTAAAG TATTATATCA AGGGTATACA TGCTTTAGAG GTTTAATTGA 1440 

TGATATTGAT TTAAAGCATC CGGaTTGTGC AAAAGAATAC TGGGGaAGAA AAGG aAGAGT 150 0 

AGGTATTGTT CCGTTATTAA ATAATCAAGC ATATTGGTTC ATTACAATTA ACTCGAAGGA 1560 

AAACAATCAT AAATATAGTT CGTTTGGTAA ACCTCATTTG CAAGCATACT TTAATCACTA 162 0 

TCCAAATGAA GTTAGAGAGA TCTTAGACAA ACAAAGTGAA ACAGGTATCT TATTGCATAA 168 0 

TATTTATGAT TTGAAACCAC TCAAATCTTT TGTTTATGGT CGTACTATTT TACTAGGAGA 1740 

TGCAGCACAT GCGACAACGC CTAATATGGG GCAAGGTGCT GGACAAGCAA TGGAAGATGC 1800 
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TAAAATACGT GTCAAACATA CTGCAAAAGT 
TGCCCAATAT CGTAGTCGTT TATTTGTTGC 

5 

AAATGCATTA GCAGCTGGAC AAACTAAATT 
CAATATGAAA ACCCCCGTAT GTTGAAACGA 
TAATGTTATT ATAATAAATT CAATTATTAG 

W 

ACGGCACTAA TTGCAGCATT AGCAACAATT 
GCATTACCAA TATGCGGTGT TAATACTACA 

, 5 TCTGGTTCAA ATTCATATAC ATCAAGTGCA 
TGCACTAGTG CTTGTTCGTG CACGATTGGA 
GATTTCATCA TTTTAAATTG TTCTGTATCA 

20 GCGTTGATAG TGATAAAATC TGCATTCTTT 
CCGATTTCTC GTTCTTTTTC TTCTTTGCGA 
AATGCTCTTG CACGACGAGC TACTGCACTA 

25 

GTTTTCCCAG ATACTTCTCT ACCTCTGAAA 
GTACGTGATA ATTGGTCCCC TTCAACAATA 
GTTAAATCAG CAGTCGCGTT TGTTGATGCT 

30 

TCTCGGGCAT ACTCGATATC AATATTATTA 
AAGTCTTTAC CAGCATCGAT AACATCTTTA 

35 GCAGTCGCGT TTTTAACACC TTTAATTAAA 
TACATTTCAA CTTCAAAATG TTCTTGTAAA 
gCAACATAAm CTTTTtCCAT AAAAGAtCAC 

40 ACAGTATACA ACTATGTCAT GATGTCTTGT 
GGAGGCGATA TAACTTAGGC ACTGTAGAAC 
CAATTAAATT AGATAACGTA GTTTTAAAGT 

45 ATATGGGAGG AAATATAAAT AAGTAGGTGG 
CTATAAAGGA AAGCTCAAAG TTTTTTGATG 
ATATGTATCA TCGTGTTTAT ATTAAATATG 

so 

AGAAATAGTT CTAGAACTTA CTGAGAAAGG 
AACTGAACCA TCACTGTTTA CACTTTCTAC 



AATTAAGCGT TCTAGAAAAA TCGGTAAAAT 1920 

AGTTAGAAAT CGTATTATGA AAATGATGCC 1980 

CTTATATAAA TCGAAAGAAA AATAATACAA 204 0 

GAGCTCAACA TATGGGGGTT CTTGTTTTTA 2100 

TTAACGACAA ATTGTGGTTT CTCACCTTGA 2160 

TTAGACATCA TGTCACGTGC TTCAAATGTA 222 0 

TTATTAAGTG ATTTTAAGTC ATCGGTAATA 22 80 

GCACCTTCAA TTTCATTATC TTTCAATGCT 2 34 0 

CCACGAGAGG CATTGATTAA ATACGCCGTA 24 00 

ATTAAATGAT GCATTTTAGG ATTATAAGCA 24 SO 

AATAGTGTAT CTAAATCTAC ATATTTTGCA 2 520 

TTAGGTCCAG TGTATAGCAC ATCCATGTCA 2580 

CCAATTTCAC CTAAACCGAT AATGCCGATT 2 64 0 

AATAAAGGTG CCCATCCATC AAATCCAGTT 2 70 0 

CGACGCGCTA CTGCAAGTAC TAATCCAATT 2760 

TTAGGTGTGT TTGTAACATC TATACTTTTT 2820 

AAACCAGCGC CATAGTTGGC AATGATTTTT 28 8 0 

TCAACGTTTG TAGATAATAA ACTAATTAAG 2 94 0 

GTGTCTTTAT CGACTAATCC TTTACCTTCA 300 0 

AGTTTTAAAC CTACTTCTGG TATtGCACCA 306 0 

TCCTTTTATC TTAGTATAGT AGAAGATTAG 3120 

GTATCAATGA TGTAAGCGCG TACTTTTGAT 318 0 

TATGAATATT GTAATGTGGA AAAACTGGAT 3 24 0 

TAATAGTATT AGAAAAAATT AATATTTTGA 3300 

CAACGAAAAA TAGCAAAAAA AGAGCTTCTC 3360 

ACATATGTAC TAGAATTAAG TTTCAAGACA 3420 

GATGTAGTTG TAG TTACCTG CTTCACTTGC 34 8 0 

TCCGCCACTA TAATT CATTT CTGAAATTGT 354 0 

ATATGCAACG TGACCAAATG GTCCTTCAGA 3600 
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AGCAGCAGCC CAATTATTAG CATTTCCCCA AGTAGAACCG ATTTCTCCGC CAACTTTATC 372 0 

ATATACATAC CAAGTACATT GTCCTGCAGT GTATAAGTTA CCAGAATGTG AAATTGATGA 3 78 0 

TGTAGTTGTC GTAGTTGTCG TAGTCGTTGT AG TTTGAGTC GTGTTGTAGT TATAGTTGTT 3 840 

GTAATTTGTA TAATTTTCAG CAGCATCTGC ATGATGTGCT TGACCTACTA ATGCTGTGCC 3900 

GATTCCTGCT GTTAACGTAG TTGCTGTTAC TAATTTTTTC ATGAATAAAG TCCTCCAAAG 3 960 

TTCTATATCT TTTTTTATAA ATAAAACGTA GCGACTGTTT TATTCTCACA TCTCGAATTG 4 02 0 

ATGACAATAG TTACTTTAAC AAAATtAATG cTTCTTGTGG GGAATGTTAT TGATTTGTAA 4 0 80 

AAGAATAAAA AAACTTTGAC TAATTTTGTA ATAAAAATTA GTCAAAGTTA CAATGAGATT 414 0 

AACAGATAAT TAATAGGAAA TATTTATTTG TAATATGTTT AAATAAATCG AATTGTTAAA 4 2 00 

GGTATTATAT ATTCTTGGCC ATTATAATAT TTGACACACG CAATAATTGT GAATACAAAA 4 2 60 

GATAATATTG AGAAAGCGAA TATGGATAAA ATACCGATAA ACGTAATGAT GAAACCTATA 4 32 0 

ATAATAATGA AATCAATATC TGTAGCAATT AGGAAAACGC CTATTAAAGT GATAACGACT 43 80 

AAAACGATAG ACCAAATAAT ATAAGAAATC GTATAGTTAA GATAATTTTT TCGAGCACGA 444 0 

TCAACTAGTT TCGATTCATC TTTTTTCAAT AACCATATTA TCAGTGGACC AATAATAGAT 4 5 00 

GTGAATAAAC TTAATAAATA GATAAGCATC GCCATAATGT TCTCATCATT GGATTTGCGA 4 560 

TTCGGTTGAT GATTTGTTAC GTCGTTCATT TCAGTTGTCA TATTAGACAC TCCTTTGAAA 4620 

ATTGTAATAT TATCTTTAAC TATAACAAAA TATAATCAAA AATAAACATG TTTATTAAAC 46 80 

AATTATTAAA AATAAAAATA ATTGGTGGAC GTCGGCGTTT AAATAGGTTA ATTTAAGGTT 474 0 

ATATATACTT AACATTTATA ATGATGCGTA ATGAATTCGC ATCATTTTTA TATTGTCTTA 4 800 

CGTATAATTT GTTTTTAATT TTAACCAAAG ATAGAAAGAG GGTTGTTTAT GAAAATAGCA 4 86 0 

ATTGTAGGAT CAGGAAATGG CGCAGTTACG GCAGCAGTAG ATATGGTGAG CAAAGGCCAC 4 92 0 

GATGTTAAAT TATATTGTCG TAATCAATCT ATAAGTAAGT TTCAAAACGC AATCGAAAAG 498 0 

GGCGGATTTG ATTTTAATAA TGAAGGTGAT GAACGTTTCG TAAAATTCAC TGATATTAGT 504 0 

GAT G ATATGG AATATGTTTT AAAAGATGCT GAAATTGTTC AAGTGATTAT TCCATCTTCA 510 0 

TACATAGAGT ATTATG CTGA TGTAATGG CA GAGCATGTAA CTGATAATCA GTTGATATTC 5160 

TTCAACATGG CTGCAGCAAT GGGGTCAATT CGTTTTATGA ATGTTTTAGA AGATAGACAT 52 2 0 

ATTGAAACAA AACCACAACT AGCGGAAgcT AATACGTTGA CGTATGGTAC GCGTGTCGAT 52 80 

TTTGAAAATG CAG CAGTTG A TTTATCTCTA AATGTACGTC GTATCTTCTT TTCAACATAT 534 0 

GATAGAAGCT GTCTAAATGA TTGTTATGAC AAAGTTTCAA GTATTTATGA TCATTTAGTA 5400 
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CCAACATTAT TGAATGTCGG 


TCGCATTGAT 


TATGCTGGCG 


AGTTCGCTTT 


ATATAAAGAA 


5520 


GGAATTACTA AACATACAGT 


TAGATTACTT 


CATGCAATCG 


AATTAGAACG 


TTTGAATTTA 


5580 


GGCCGTAGAT TAGGTTTTGA ATTATCAACA 


GCTAAAGAAT 


CACGTATTGA 


ACGTGG TTAT 


5640 


TTAGAACGTG ATAAAGAAGA 


TGAACCATTA 


AATCGTTTGT 


TTAATACAAG 


CCCAGTATTT 


5700 


TCACAAATTC CAGGACCAAA 


TCATG TAG AA 


AGCAGATATT 


TAA CTGAAG A 


T ATTG CAT AT 


5760 


GGTTTAGTAC TATGGTCAAG 


CTTAGGTCGT 


GTTATTGATG 


TACCGACACC 


AAATATAGAT 


5820 


GCAGTAATTG TAATTG CATC 


AACCATTTTA 


GAGAGAGACT 


TCTTTGAGGA AGGCTTAACA 


5880 


GTTGAAGAAA TTGGTTTAGA 


TAAGCTTGAT 


TTAGAAAAAT 


ATTTAAAATA 


AATGATGGCT 


5940 


TGAAGATAGA AAAGGATATA 


GCATTATGCA 


AAAGCAATAA 


ATT GAAGAAA 


AGAGGTTTCT 


6000 


CAT C AATAAG CGnAGGGGAC 


GATAGATGAT 


GAAAAGAAAA 


CCCACCTTTT 


TAGAATCAAT 


6060 


TTCGACAATG ATTGTAATGG 


TTATTGTTGT 


TGTAACAGGC 


TTTGTGTTTT 


TTGATATTCC 


6120 


AATTCAAGTA TTATTAATTA TTGCCTCAGC ATATGCCACA TGGATTGCAA AACGTGTAGG 


6180 


CTTAACATGG CAAGATTTAG 


AAAAAGGCAT 


TGCAGAACGT 


TTAAATACTG 


CAATGCCTGC 


6240 


AATTTTAATT ATACTAGCGG 


TAGGAATTAT 


AGTAGGCAGT 


TGGATGTTTT 


CTGGCACAGT 


6300 


GCCAGCCTTG ATTTATTATG 


GCTTAGATTT 


ATTGAATCCA 


AGCTATTTTT 


TAATATCAGC 


6360 


CTTTTTTATA AGTGCTGTTA 


CATCTGTAGC 


AACTGGTACA 


GCATGGGGCT 


CTGCATCAAC 


6420 


TGCAGGGATT GCACTTATTT 


CTATTGG TAA 


TCAATTGGGG 


ATTCCTCCAG 


GGATGGCAGC 


6480 


GGGTGCTATT ATAGCAGGGG 


CTGTGTTTGG 


CGATAAAATG 


TCAC CATTAT 


CAGATACAAC 


6540 


TAATTTAGCG GCGCTTGTTA 


CTAAAGTTAA 


TATATTTAAA 


CATATACATT 


CGATGATGTG 


6600 


GACGACGATA CCTGCATCAA 


TCATAGGTTT 


ATTAGTATGG 


TTTATTGCTG 


GATTTCAATT 


6660 


TAAftGGGCAT TCAAATGATA 


AACAGATTCA 


AACTTTGTTA 


TCAGAGCTTG 


CACAGATTTA 


6720 


TCAAATTAAC ATATGGGTCT 


GGGTTCCCTT 


AATTGTGATC ATTGTTTGTT TGCTATTTAA 


6780 


AATGGCTACA GTGCCAGCTA 


TGCTAATATC 


AAGCTTTTCT 


GCCATTATAG 


TGGGGACTTT 


6840 


TAATCATCAT TTCAAAATGA 


CAGATGGTTT 


CAAAGCAACA 


TTTAGTGGTT 


TTAACGAATC 


6900 


AATGATACAT CAGTCTCATA 


TTTCATCCAG 


TGTGAAAAGC 


TTGTTAGAAC 


AGGGTGGTAT 


6960 


GATGAGTATG ACCCAAATAT 


TAGTAACGAT 


ATTTTGC GG A 


T ATG CATTTG 


CAGGTATTGT 


7020 


AGAAAAAGCA GGATGTTTAG 


AAGTCTTATT 


AACTACTATT 


TCTAAAGGCA 


TCCATTCTGT 


7080 


AGGAAGTTTA ATATG T ATT A 


CTGTTATTTG 


TTGTATTGCG 


CTTGTATTCG 


CTGCAGGTGT 


7140 


TGCTTCGATT GTAATTATTA 


TGGTCGGTGT 


GTTAATGAAA 


GATTTGTTCG 


AAAAATACCA 


7200 
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AATACCATGG GGAACATCAG GTATTTACTA TACGAATCAA CTTCATGTCT CTGTTGAAGA 73 2 0 

ATTTTTCATA TGGACAGTAC CATGTTATTT ATGCGCAATT ATAGCAATTA TCTATGGTTT 73 8 0 

5 TACAGGGATA GGTATTAAAA AGTCATCGAA TTCACGTTTA ACTTAATGTG AGCGTGGAAT 744 0 

ATATATAATA TGTTGAAACA CTTTAATCAT TTATAATTGT AG CGGTTATA ATTTGAAAAG 7 5 00 

GTTTTAACTT AGAATAAATA TCCTCTATGC ATATACTGAA TATGTTTTGT AGCGGAACAT 7 56 0 

w 

GTTGATATAT GTAATGTAAG TTTTATGTCA TGATTTGTAA TGACTAAATT AATTGAGAAT 7 62 0 

TTGAAGGCAA GTATATTTGT AAGTACTTTA ACTAAAAATT TAT CAATGTA TAGCCGATTT 768 0 

^ GACATGCCTA AATTTGGGTG TGTCAATGGC TGTATGTTGT TTATTCTTTA TTACAGAGTG 77 4 0 

AATCGGATTG GTGAAAATCG AAATTTTGAG ATTTTTACCA ATTCGATTTT TTTCATAGAA 78 0 0 

ATTAAAAAAG CCAACAAGGC TCTTGAAACC TTGTTGGCGT AAA CAT AG CC ATCACTAATT 7 860 

20 AGTGAATGAA GTTATAACCA GCAGCTTGGC TAGCTGAGAT TGTACGTGAA GTTACAACAC 7 920 

CTGGGCCATA ACCATAGTTC ATTTCTGAAA CTCTTACTGA ACCATTGCTG TTAACACTTT 79 8 0 

CAACGTATGC AACGTGACCG TATGCACCTT GAGTTGTTTG CATAATTGCA CCAG C TTTTG 8 04 0 

25 GTGTATTGTT CACTGTGTAA CCAGCTCTTG CAGCTGCGTT AGCCCAGTTA CTTGCATTGC 8100 

CCCAAGTTGA ACCGATTTTA CCACCTACAC GATCAAATAC GTAGTATGTA CATTGACCAG 816 0 

AAGTGTATAA GTTACGTCCT GAAGTATAAC CACTTGAGAT TGAACGGCCA TTTGATGATG 822 0 

30 

GAGCCATAGT TGTAGTTACT TGAACATTGT TGCTTGAAGT GCTGTAGCTT GCACCTAAAC 82 8 0 

CACCAGTACG GTAGCTGTTT GTGTTGTAAC TATTATAGTT ATTGTAGTTA TATGATTGAT 834 0 

TATTATTTGA GTAGTTGTTG TAACGGCTGT AGTTATTGTA GCTATAACCG TTGTTGTAAT 84 00 

35 

TGTTATAGTT ATTGTAACCA TTGTAGTAGT AATAGCTGTA GTAGC CATTA TCTTGGTTTA 84 6 0 

ATTGACTTGG ATGCCAGTTA CCTTTCCATG TGTAATGGTA GTTACCTTGT GCATCAATAG 852 0 

40 TGTAAGTATA GCTATATGAT GTTGGGTCGT TTGGATTATA ACCGTAGTTA TCTTGCTCAG 8 58 0 

AAGCATGAGC TTGATTT CCT GATGCAATTG CGATTGTAGC GAATCCTGCA GTTGCGATAG 864 0 

TAGCTGTAGC G ATTTTC TTC ATTTTAAAAA TATCCTCCTA AAAATTTTAA ATCTAAAATA 8700 

4S TTTTCGTAAT GTCCGTGTGA CAAAATTAAT GTTATAAGTT ATCTCTCGTA ATTAAACGAC 8760 

AAGAAAGACT ATAACAGAAA TTAGCGTCCT TGTGTGCTTT GTTAAC GTTT TGTAATTTTT 8 820 

TGCTAATATC TTGACACAAT AGAATTTTAA AAGTATAGAA ATTTGCATTT TGCAAAACTT 8 88 0 

SO 

ATAACTACGG CATTCTTTGT GAAAACTGAA TGTTTCGAAA ATAAGTCTGT TACAAATTTG 8 94 0 

TAATATTACT GAAAATTCTA AATGTATATT TTGTGCATAA TATAGGACTT TTAATCAGAA 9000 
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GGATGAAAAT GTATATTTAA TGGATAAAAT ATCCTAATTT AGCATAAAAA AATGTTTTAA 9120 

TAAAAGTATT ATTTGATATA ATCGATTTAT GTTTTGTTAC TGCTAAAAAA CATGTGGCG 9179 
S (2) INFORMATION FOR SEQ ID NO : 101: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1868 base pairs 

(B) TYPE: nucleic acid 

w (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 101: 

15 

CCTTCAGCCA TTTGACTTCG ACATGAGTTG CCTGTACATA TAAAATAAAT TGTTTTTTTA 60 

GTCATAACAA TCTCCTAATT AATTAAAATA TGATAAGTGT TAGATACAAC CCTATGAGGG 120 

20 TTATAAATAG TACTGGAATT GTAATGATGA TACCAGTTTT AAAGTATGTG CCCCAAGAAA 180 

TCTTAACATC TTTTTGCGTT AAGACGTGTA ACCACAGTAA TGTAGCTAAA GAGCCTATCG 240 

GTGTAATTTT TGGACCTAAA TCAGAACCGA TAACATTCGC ATAAATTAGG CCTTCTTTTA 300 

25 ACATGCCATG GACATTTGAT TGACCAATAG CAATCGCATC TATTAAAACT GTAGGCATAT 3 60 

TATTCATTAT TGATGATAAA AACGCTGAAA TGAAGCCCAT TCCCAAAATA GTGCTAAATA 420 

GACCGTAATT GGAAATATAT TCTAATATTT TAGCCAATAT TAAAGTAATG CCAGCATTTC 4 80 

50 TTAAGCCGAA TACGACGATA TACATAC CAA TTGAAAATAA TACTATATTC CAAGGTGCGC 540 

CCTTAATGAC TTGCTTAATA TTT ACAG CAT TTGATTTACG AGC CAACATT AGAAAAATAA 600 

AAGCAATGAT TCCAGTGAAA ATTGATACCG GAATTTTAGT AAATTTACTG ATTAGATAGC 660 

35 

CGAAAAGTAA TATAACTAGA ACAATCCaTG AAATTTTAAA TAGCTTTAAA TCATTAATGG 720 

CATCTTTAGG ATGCTTTATA TTATTATCAT CAAACGTTTT AGGTATCGCT TTTCTAAAAT 780 

4o ATAACCACAA TACTATAATA CTTGCTAAAA GCGAGAATAA ATTAGGTATA ATCATTCT A C 84 0 

TAAAATATCG AACGAATCCT ACATGAAAAT AATCAGCAGA TATAATATTC ACTAGATTGC 900 

TCACGATTAA AGGTAAAGAA GTTGTGTCAG CTATAAAACC ACTCGCAATA ATnAAAGGGA 960 

45 ATATGGCCCG CTTACTAAAA CCTATATTTT TAACCATCGC TAATACAATA GGCGTTAAGA 102 0 

TTAAcGTGCG CCATCATTTG CGAAAAATGC AGCAACAATG GCACCCAATA ATATGATATA 10 8 0 

AACGAACATT TTTAAACCAT TGCCTTTTGA AGCATGAAGC ATGTGAATAG CTGACCATTC 114 0 

50 GAATAATCCA ACTTTATCTA ATATTAATGA AATAAGAATG ACT GAGA CAA AAGTCAAAGT 12 00 

AGCATTCCAA ACAATACCTG TTACTTCGAA AACATCGGAA AAACTTACAA CACCAGTAAT 12 6 0 
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TAATACAAAT AATAAAGTTA CTAGAAAAAT GAGTGTCGCT AAAGTTGTCA TCATTAGCAT 13 80 

TCACCAGTCT TAAGGTTATG ACAAATACAT CGTTGGTTAG AGGTATGAAC CTTAGACAAG 144 0 

TTATTAATTA CGGACTCAAA AATATTATGA TTgAGCTGGT ATAAATGTTT ATTTCCGATT 1500 

TTTCGTGTCG TAACTAAGTT GGTTTTTACT AATGCTTTCA TATGrTAGCT AAGTGTAGGT 1560 

TGAGAGAATT GAAAATGTGC TAACAAATCA CAAGCGCATA ACTCTCCACA AGAAAGTAAA 162 0 

TCTAGTATTT CTAATCTGCT TGAATCTGAT AAAACTTTTA AAAATGTTGC TAGTTCTTTA 168 0 

TACGTCATAA CATACCTCCT AGACGTTAAA TAGATTATCA TCTATATAGA TGAATGTCTA 174 0 

TGTTCCTTTG GTATATTACA CGATATGACT ATGTAATTTA AATTTGGTTT TAGTATTAAA 18 00 

AGGGTATTAA AGATAAATTA TAGATATTGA TTTTGCAAAA TATACTCTTT GTTCTGCATT 1860 

GAAAAAGG 1868 



20 (2) INFORMATION FOR SEQ ID NO: 102: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1524 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 102: 

30 

ATTTATGAAA TCCATAGCnA TAAACATTAT TCTTGCATCG GCTATACAAA CAGTTACCGC 60 

AAGCAAATTT GTATATCAAC CTGGAATTGT GTTCACGTCA ATGGCaAATG CCGATGATGT 12 0 

GTTATCAGGC GATAGTTATT TTATGG CTG A ATTAAAATCT ATTAAGCGTA TTGTTGAAAT 18 0 

35 

TCCAGATAAT CAAAAAATAT ACTGCTTTAT AGATGAAATT TTTAAAGGTA CCAACACAAC 24 0 

TGAACGAATT GCCGCTTCAG AATCAGTACT ATCATTTTTA CATGAAAAAT CTAACTTTAG 300 

40 AGTTATTGCA GCAACACATG ATATTGAGTT AGCTGAACTC TTAAAACAAC GTTATGAAAA 360 

TTACCATTTC AATGAGGTAA TAGAAAATAA TAACATACAT TTTGATTACA AAATTAAGCC 42 0 

TGGCAAAGCA AATACACGTA ATGCCATCGA ATTATTAAAA ATCACTTCAT TTCCAGCAAA 480 

45 AATATATGAA CGAGCAAAAG ATAATGTCCC GAAAATTTAG CATTTAACTT TAAACATAAA 54 0 

AACGTCAGCT ATCACATGAC AGAAGACTAT GAACAGTTTC AATAATGTTC ATAGTAATCA 60 0 

TGTTAATAAC TGACGTTTAT TTTATTCTGC AGAATACTCT TCTAAATCTA TATTGCTGTG 66 0 

SO 

CCCATTTAAT GCTAAATCAG CAAAT CGACC TTGCTGATAC AAATAGTGGC CGGCAACGCC 720 

TATCATTGCA GCATTATCTG TGCATAATTT AGGACTTGGG ATAGTTAATT GAATGTCATT 78 0 
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AACAATTAAT CGCTGAACAC CATATTCTTT ACAAGCTTGA ATAGCTTTAA ACGTGAGCAC 9 00 

CTCTACAACA CTGTTTTGAA AGCTCGTTGC TACGTTAGCT TCAATGATTG GaATATTTTT 960 
TTGTCGTTGA TTGTGAAGTT GATTGATTAC GGCACTTTTC AACCCACTAA AA CTAAAAT C 102 0 

ATAACTATCT TTATCCAACC AAACACGAGG GAATGAATAA GTATCTTCAC CTT CAGCAGC 108 0 

CAACCGATCA ACTTGTGGAC CACCTGGATA ATTTAAACCA ATTGTTCGTG CCACTTTATC 114 0 

ATAAGCCTCA CCTACTGCGT CATCTCGTGT TTCACCAATG ACTTCAAATG ATAAATGATC 12 00 

CTTCATATAA ACTAATTCAG TATGTCCACC TGAAACAATA AGTGCAATTA GCGGGAATGT 1260 

TAATGGCTCT TCTATGTGAT TAGCATATAT ATGTCCTGCA ATATGATGAA CAGGAATAAG 13 20 

TGGCTnATCG TAAGCAAATG CCAATG CTTT GGCTGCATTA ACACCTATTA GTAACGCACC 13 BO 

AATTAGTCCA GGGCCTTCTG TAACCGCTAT GGCATCAATA TCTTCTATTG ATACATCGGC 14 4 0 

ATCCCCTAGA GCCTCGTTTA TTGTTGCTGT TATAC CTTCA ACGTGATGTC TACTTGCCAC 1500 

TTCGGGAACG ACACCGCCAA ATCGTTTATG ACTTTCAATC TGACTTAAAA CTGTATTTGA 156 0 

TAAAATATCT CTGCCATTTT TTATAACACT AACGCTTGTT TCATCACAAC TTGTTTcAAC 16 20 

AGCTAGTATT AATATATCTT TAGTCATTTA AATTCACCCA CATAACCATT GCGTCCTCAC 16 8 0 

CTTCACCATA ATAATTTTTA CGTTTACCAC CATATTGAAA TCCTAAATTT TCATATACAT 174 0 

GTTGTGC CAC TTTATTATTA ACTCTTACTT CTAAACTCAT CACATCACAA GTGTGACTTG 1800 

CATAGTTTAT TCCGTATTTT AAAAGCATTT GACCTAAACC ATAGCCTCTA TAATTATCAT 18 6 0 

CGATTGCAAC TGTTGTAATT TGAGCTTGAT CGATAACAAT CCATAAACCT AAATAACCAA 192 0 

TAATTTG TTG TTCAAATTCt AAGACAAAAT ATTTCGCAAA GTTATTTTGC TCTATTTCAT 19 80 

GATAAAATGC GTCAATTGTC CAAGAACTGT CATTGAAACT CCGACGCTCA AGATCAAAGA 204 0 

CTTqTGGCAC ATCTTCTTTA GTCATCTCTC TAATGTTTAA TTGTTC TT TT GACTGTTGAT 210 0 

CCAATTTCGT TCCGCCTCAG CTAATTTATG GTATTTAGGA GTAAATGTAT GTACGTCTGA 2160 

AGGTTTATCT AGCAATTGAT ACATGACTGA TGCATTTGGT AGctGCGCAA TCACTTCACC 2220 

TTGTAATTCA TCTTGTAATT TTACAGTATC TTTCCCAATA TAAATAAATG G TTGGTTT AA 22 80 

ATCTTCTAAA AAAGCTCGCA ATGCCTCTAT CGACATATAT TGATCTTCTA AAATAGTCAC 2 340 

TAATTGACCA TTTTGCCACT GGAATATGCC TGTATAAACT GCTTGTCGTC TTGCATCAAA 24 00 

CACAGGAACC AATAATTTAT CAGTATGATC GATTGTTGCT GCCAATGCCT TTAATGATGA 24 60 

AACACCATAT AATTTAACAT CTAACGCATA CGCTAATGTT TTAGCAACAG TAACACCGAT 2 52 0 

ACGTAAGCCA GTATATGAAC CAGGACCTTC AGCAACAATA ATCGCATCTA ATTGCTGTTT 25 80 
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TTGTTTAGAA TCCGTAGTTA TTTCAGCTAA AACTTCATCG TTTTGCATCA ATGCTACTGA 270 0 

TAATGGTTGA TTCGATGTAT CAATGAG CAG CGAATTCATG GATAATTGCC TCCTTAATTT 276 0 

GTTCATAATG TTCTCCTTGC GCGAACAACT CAATTTGTCT TGTATTTTCA GATATTGTTG 282 0 

AAATGTTAAT AGATAAATGC GTCGCTGGAA GTAAATCTTT TATAAATTGA CTCCATTCAA 28 8 0 

TAACAGTAAT TGCCTGATCT TCGAAAAATT CATCAAATCC TAAATCTTCA TCAGAATCTT 2 94 0 

CTAAGCGATA ACAATCCATA TGATG CAATT TTAAATTTTT ACCCCTATAT GATTTAATGA 300 0 

TGTTAAATGT CGGGGAATTA ATCGTACGTC TTACACCAAG AGCTTTT CCT ATAAATTGCG 306 0 

TTAACGTTGT TTTACCTGCT CCTAAATCTC CGTTAAG TAA AATCAAATCA CCACTTTTCA 312 0 

ATTGCTCAAC TAAAAATATA GCAAATTGAT TCATTTCATC TAAATTATTT ATCTTTATCA 318 0 

ATGTTGATTC TCCTATATTA TGCTTTTCAT TCATAAAAAT GATTATCCAT TGTTCAATCG 324 0 

TATCTAACTT TATATTTAAC CTTTATATTG TAACAAATTT CAACTTAAAT TTCTTATCTT 3 30 0 

TGAAA CAG AT TATCTATTCA AAGTTAATTG TAAGAAAATT TAAAATATTT GTTGACATAC 3 3 60 

TAAAGCAGAT ATAGTAAATT AAATTTATCA AATTTTTAGA CAATTCTAAC TATTAAAGTG 34 20 

ATATATACCA TTCACGGAAG GAGTATAATA AAATGCTTAA TCAATATACT GAACATCAAC 34 SO 

CGACAACTTC AAATATTATT ATTTTATTAT ACTCTTTAGG ACTCGAACGT TAgTAAATAT 3 54 0 

TTACTAAACG CTTTAAGTCC TATTTCTGTT TGAATGGGAC TTGTAAACGT CCCAATAATA 3 6 00 

TTGGGACGTT TTTTTATGTT TTATCTTTCA ATTACTTATT TTTATTACTA TAAAACATGA 3 660 

TTAATCATTA AAATTTACGG GGGAAT TTAC TATG CGAaCG AgcATGATCA AAAAAGGAGA 3720 

TCACCAAGCA CCAGCAAGAA GTCTTTTACA TGCCACGGGC GCGCTAAAAA GTCCAACTGA 3 7 80 

TATGAACAAA CCATTTGTAG CTATTTGTAA CTCTTATATT GATATTGTTC CTGGACATGT 384 0 

TCACTTGAGA G AGCTTG CAG ATATAG CTAA AGAAGCAATT AGAGAAGCCG GTGCCATTCC 3 9 00 

ATTTGAATTC AATACAATTG GTGTTGATGA TGGAATAGCT ATGGGACATA TCGGAATGCG 3 960 

ATATTCTCTA CCATCACGTG AAATTATTGC AGATG CAG CT GAAACTGTAA TTAACGCTCA 40 2 0 

TTGGTTTGAC GGCGTATTTT ACATTCCTAA TTGTGACAAG ATTACACCCG GTATGATTTT 4 08 0 

AGCAGCCATG AGGACAAACG TACCAGCTAT CTTTTGCTCT GGTGGACCAA TGAAAGCTGG 414 0 

CTTATCTGCA CATGGAAAAG CATTAACACT TTCATCAATG TTTGAAGCAG TCGGCGCATT 4 200 

TAAAGAAGGA TCGATTTCTA AAGAAGAATT TTTAGATATG GAACAAAATG CCTGCCCTAC 4 26 0 

TTGTGGTTCA TGTGCTGGGA TGTTTACTGC AAATTCAATG AACTGTTTGA TGGAAGTTTT 432 0 

AGGTCTAGCA TTACCATACA ACGGTACTGC ACTTGCAGTC AGTGATCAGC GACGAGAAAT 438 0 
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TATCGTTACT CGCGAAgCAA TTGATGATGC ATTTGCACTT GATATGGCTA TGGGTGGTTC 4 5 00 

AACAAACACG GTACTGCATA CGTT AG C CAT TGCCAATGAA GCTGGTATTG ATTATGACTT 4 56 0 

AGAGCGCATT AATGCTATTG CCAAACGCAC GCCATATTTA TCAAAAATAG CACCTAGTTC 4 620 

ATCGTATTCA ATGCATGATG TGCATGAAGC TGGTGGCGTC CCAGCAATTA TTAATGAATT 4 6 80 

GATGAAG AAA GATGGCACGT TACACCCAGA TAGAATCACA GTTACTGGCA AAACGTTACG 4 74 0 
TGAAAATAAC GAAGGCAAAG AAATTAAGAA CTTTGATGTC ATTCACCCTC TTGATGCACC . 4 80 0 

ATATGATGCA CAAGGCGGTT TATCTATCTT ATTTGG T AAT ATCGCCCCTA AAGGCGCAGT 4 86 0 

TATTAAAGTT GGCGGCGTTG ATCCATCTAT CAAAACATTT ACTGGGAAAG CAATTTGTTT 4 92 0 

CAATTCGCAT GATGAAG CTG TTGAAGCAAT AGACAATCGT ACCGTTCGTG CAGGCCACGT 4 980 

CGTTGTCATT AGATATGAAG GACCTAAAGG TGGACCAGGT ATGCCTGAAA TGTTAGCACC 504 0 

TACTTCCTCT ATTGTTGGTC GCGGCTTAGG TAAAGATGTT GCATTAATTA CTGATGGGCG 510 0 

TTTTTCCGGT GCCACAAGAG GTATTG CAGT TGGTCATATT TCCCCTGAAG CTGCATCTGG 5160 

TGGAC CAATT GCCTTAATTG AAGATGGTGA TGAGATTACT ATTGATTTAA CAAATCGTAC 522 0 

ATTAAACGTA AACCAGCCTG AAGATGTTCT AGCGCGTCGC CGAGAATCTT TAACACCATT 5280 

TAAAGCGAAA GTAAAAACAG GTTATCTAGC TCGTTATACT GCCCTAGTAA CTAGCGCAAA 5340 

TACAGGTGGC GTCATGCAAG TCCCTGAGAA TTTAATTTAA TTTATTTTTA TATTGGAGAT 54 00 

GGTTAAAATG TCTAAAACTC AACATGAAGT AAACCAAAAT ATTGACCCTT TAAAAATGGC 54 6 0 

TGAATCACTT GAACCTGAAC AACTAAATGA AAAAACTTTA AATGATATGC GTTCAGGATC 552 0 

AGAAGTGCTA GTAGAAGCTC TACTTAAAGA AAATGTGGAT TATTTATTCG GTTATCCTGG 5580 

TGGTGCCGTA CTACCTTTAT ATGACACGTT TTATGATGGT AAAATCAAAC ATATTTT AG C 564 0 

AAGA~CACGAA C AAGGTG CTG TTCATGCTGC AGAAGGTTAT GCACGTGTAT CTGGTAAamT 5700 

GGCGTCGTTG TAGTTACAAG CGGTCCaGGT G CAACTAATG TAATGACAGG TATTACGGAT 576 0 

GCACATTGCG ACTCTTTACC TCTAGTTGTA TTCACTGGAC AAGTTGCTAC ACCAGGCATT 582 0 

GGTAAAGATG CATTCCAAGA AGCGGATATT CTATCTATGA CTTCACCAAT TACAAAACAA 5880 

AATTATCAAG TGAAACGTGT TGAAGATATC CCTAAAATCG TACACGAAGC TTTCCATGTA 594 0 

GCTAATTCTG GACGCAAAGG TCCTGTAGTG ATTGATTTTC CAAAAGATAT GGGTGTTTTA 6 000 

GCTACAAATG TGGATTTATG CGACGAAATC AATATTC CAG GTTATGAAGT TGTTACAGAA 6060 

CCAGAAAATA AAGACATTGA CACTTTCATC TCACTTTTAA AAGAAGCGAA AAAGCCTGTC 6120 

GTATTAGCCG GCGCAGGTAT TAATCAATCA AAATCAAATC AATTATTAAC ACAGTTTGTT 618 0 
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GATACACTAT TTTTAGGTAT GGGAGGAATG 


CATGGTTCTT ATGCTAGTAA 


CATGG CATTA 


6300 




ACTGAGTGTG ATTTACTCAT 


TAATTTAGGT 


AGCCGCTTCG ATGATAGATT 


AGCAAGCAAA 


6360 




CCTGATGCCT TTGCACCTAA 


CGCCAAAATT 


GTACATGTAG ATATTGATCC 


TTCAGAAATC 


6420 




AATAAAGTTA TTCATGTAGA 


TTTAGGTATT 


ATTGCAGACT G TAAAAG ATT 


TTTAGAATGT 


6480 




TTAAATGATA AAAATGTTGA 


GACTATAGAA 


CACAGTGACT GGGTTAAACA 


TTGTCAAAAT 


6540 


to 


AATAAGCAGA AACACCCATT 


TAAACTTGGT 


GAAGAAGATC AAGTATTTTG 


TAAG CCACAA 


6600 




CAAACAATCG AATATATCGG 


CAAAATTACA 


AATGGTGAAG CAATTGTTAC 


TACAGACGTG 


6660 


15 


GGACAACATC AAATGTGGGC 


AGCTCAATTT 


TATCCATTTA AAAATCACGG 


ACAATGGGTT 


6720 




ACAAGCGGTG GTTTAGGAAC 


AATGGGATTC 


GGTATTCCTT CGTCAATTGG 


TGCCAAATTA 


6780 




GCTAATCCTG ATAAAACAGT 


CGTATGTTTC 


GTCGGTGACG GTGGTTTCCA 


AATGACAAAC 


6840 


20 


CAAGAAATGG CACTTTTACC 


CGAATATGGT 


TTAGATGTCA AAATCGTACT 


AATCAATAAT 


6900 




GGAACATTAG GTATGGTTAA 


ACAATGGCAA 


GATAAGTTCT TTAATCAACG 


CTTCTCACAC 


6960 




TCAGTATTTA ATGGTCAACC 


TGATTTTATG 


AAAATGGCAG AAGCATATGG 


CGTCAAAGGT 


7020 




TTCTTAATCG ATAAGCCAGA 


ACAACTGGAA 


GAACAATTAG ATGCAGCGTT 


TGCTTATCAA 


7080 




GGACCAGCTT TAATTGAGGT 


TCGTATTTCC 


CCTACTGAAG CTGTAACCCC 


AATGGTTCCG 


7140 




AGTGGCAAAT CAAATCATGA 


AATGGAGGGC 


TTATAATGAC AAGAATTCTT 


AAATTACAAG 


7200 


30 


TTGCGGATCA AGTCAGCACG 


CTAAATCGAA 


TTACAAGTGC TTTTGTTCGC 


CTACAATATA 


7260 




ATATCGATAC ATTACATGTt 


ACACATTCTG 


AACAACCTGG GATTTCTAAC 


ATGGAAATTC 


7320 


35 


AAGTCGATAT TCAAGATGAT 


ACATCACTTC 


ATATATTAAT TAAAAAATTA 


AAACAACAAA 


7380 




TTAATG TTTT AACGGTTGAA 


TGCTACGACC 


TTGTTGATAA CGAAGCTTAA 


TTTTAAGACA 


7440 




aaggCaatga tgcgctaatt agttatagat atatcatagg ctgctagtta acatctgcca 


7500 


40 


CTATTACAAA GTTATATTTC 


AGAATTTTCG 


AAACACAAAA TATTTAATTA 


TTTGGAGGAA 


7560 




TTTATTATGA CAACAGTTTA 


TTATGATCAA 


GATGTAAAAA CGGACGCTTT 


ACAAGGCAAA 


7620 




AAAATTGCAG TAGTAGGTTA 


TGGATCACAA 


GGTCACGCGC ATGCACAAAA 


CTTAAAAGAC 


7680 


45 


AATGGATATG ATGTAGTCAT 


CGGCATTCGC 


CCAGGTCGTT CTTTTGACAA 


AG CT AAAGAA 


7740 




GATGGATTTG ATGTGTTCCC 


TGTTGGAGAA 


GCAGTTAAGC AAGCTGATGT 


AATTATGGTG 


7B00 




CTATTACCTG ATGAAATTCA 


AGGTGATGTA 


TACAAAAACG AAATTGAACC 


AAATTTAGAA 


7860 


50 


AAACATAATG CGCTTGCATT 


TGCTCATGGC 


TTTAACATTC ATTTTGGTGT 


TATTCAACCA 


7920 




CCAGCTGATG TTGATGTATT 


TTTAGTAGCT 


CCTAAAGGAC CGGGTCATTT 


AGTTAGACGT 


7980 



£5 
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CAAGCACGTA ATATTGCTTT AAGTTATGCA AAAGGTATTG GTGCAaCTCG TGCAGGTGTT 8100 

ATTGAAACAA CATTTAAAGA AGAAACTGAG ACAGATTTAT TTGGTGAACA AGCAGTACTT 8160 

TGCGGTGGTG TATCGAAATT AATTCAAAGT GGCTTTGAAA CATTAGTAGA AGCGGGTTAT 82 2 0 

CAACCAGAAT TAGCTTATTT TGAAGTATTA CATGAAATGA AATTAATCGT TGATTTGATG 82 8 0 

TATGAAGGCG GTATGGAAAA TGTACGTTAC TCAATTTCAA ATACTGCTGA ATTTGGTGAC 8 34 0 

TATGTTTCAG GACCACGTGT TATCACACCA GATGTTAAAG AAAATATGAA AG CTGTATTA 84 00 

ACTGATATCC AAAATGGTAA CTTCAGTAAT CGCTTTATCG AAGACAATAA AAATGGATTC 84 6 0 

AAAGAATTTT ATAAATTACG CGAAGAACAA CATGGTCATC AAATTGAAAA AGTTGGTCGT 8 5 20 

GAATTACGCG AAATGATGCC TTTTATTAAA TCTAAAAGCA TTGAAAAATA AGATAGACCT 858 0 

ACAATGAGGA GTTGTTAAAT ATGAGTAGTC ATATTCAAAT TTTTGATACG ACACTAAGAG 8 64 0 

ACGGTGaACA AACACCAGGA GTGAATTTTA CTTTTGATGA ACGCTTGCGT ATTGCATTGC 870 0 

AATTAGAAAA ATGGGGTGTA GATGTTATTG AAG CTGGATT TCCTGCTTCA AGTACAGGTA 8 760 

GCTTTAAATC TGTTCAAGCA ATTGCACAAA CATTAACAAC AACGGCTGTA TGTGGTTTAG 8 8 20 

CTAGATGTAA AAAATCTGAC ATCGATGCTG TATATGAAGC AACAAAAGAT GCAGCGAAgC 8 880 

CGGTcGTGCA TGTTTTTATA GCAACATCAC CTATTCATCT TGAACATAAA CTTAAAATGT 8 940 

CTCAAGAAGA CGTTTTAGCA TCTATTAAAG AACATGTCAC ATACGCGAAA CAATTATTTG 9 000 

AC GTTGTTCA ATTTTCACCT GAAGATGCAA CGCGTACTGA ATTAC CATTC TTAGTGAAAT 9060 

GTGTACAAAC TGCCGTTGAC GCTGGAGCTA CAGTTATTAA TATTCCTGAT ACAGTCGGCT 9120 

ACAGTTACCA TGATGAATAT GCACATATTT TCAAAACCTT AACAGAATCT GTAACATCTT 9180 

CAAATGAAAT TATTTATAGT GCTCATTGCC ATGACGATTT AGGAATGGCT GTTTCAAATA 924 0 

GTTTAGCTGC AATTGAAGGC GGTGCGAGAC GAATTGAAGG CACTGTAAAT GGTATTGGTG 93 00 

AACGAGCAGG TAATGCAGCA CTTGAAGAAG TCGCGCTTGC ACTATACGTT CGAAATGATC 93 6 0 

ATTATGGTGC TCAAACTGCT CTTAATCTCG AAGAAACTAA AAAAACATCG GATTTAATTT 94 2 0 

CAAGATATGC AGGTATTCGA GTGCCTAGAA ATAAAGCAAT TGTTGGCCAA AATGCATTTA 94 8 0 

GTCATGAATC AGGTATTCAC CAAGATGGCG TATTAAAACA TCGTGAAACA TATGAAATTA 954 0 

TGACACCTCA ACTTGTTGGT GTAAGCACGA CTGAACTTCC ATTAGGAAAA TTATCTGGTA 96 0 0 

AACACGCCTT CTCAGAGAAG TTAAAAGCAT TAGGTTATGA CATTGATAAA GAAGCGCAAA 96 6 0 

TAGATTTATT TAAACAATTC AAGGCCATTG CGGACAAAAA GAAATCTGTT TCAGATAGAG 972 0 

ATATTCATGC GATTATTCAA GGTTCTGAGC ATGAGCATCA AGCACTTTAT AAATTGGAAA 978 0 



605 



EP 0 786 519 A2 





AAGAGGGTCA 


TATTTACCAG 


GATTCAAGTA 


TTGGTACTGG TTCAATCGTA 


GCAATTTACA 


9900 




ATG GAGTTGA 


TCGTATTTTC 


CAGAAAGAAA 


CAGAATTAAT TGATTAT CGT 


ATTAATTCTG 


9960 


5 


TCACTGAAGG 


TACTGATGCC 


CAAGCAGAAG 


TACATGTAAA TTTATTGATT 


GAAGGTAAGA 


10020 




CTGTCAATGG 


CTTTGG TATT 


GATCATGATA 


TTTTACAAGC CTCTTGTAAA 


GCATACGTAG 


10080 




AAGCACATGC 


TAAATTTGCA 


GCTGAAAATG 


TTGAGAAGGT AGGTAATTAA 


TTATGACTTA 


10140 


W 


TAACATTGTT 


GCCCTACCTG 


GTGATGGAAT 


CGGTCCAGAA ATTTTGAACG 


GATCTCTATC 


10200 




ATTGCTTGAA 


ATTATAAGTA 


ATAAATATAA 


CTTTAATTAT CAAATAG AG C 


ACCACGAATT 


10260 


15 


TGGTGGTGCC 


TCTATTGATA 


CATTCGGCGA 


GCCTTTAACT GAGAAAACCT 


TAAATGCGTG 


10320 




TAAAAGAGCA 


GATGCTATTT 


TACTGGGTGC 


AATCGGTGGA CCTAAATGGA 


CAGATC CTAA 


10380 




CAATCGACCA 


GAACAAGGAT 


TATTAAAATT 


GCGTAAATCC TTAAATTTAT 


TTGTAAATAT 


10440 


20 


ACGCCCCACT ACCGTTGTCA AAGGCGCTAG 


TTCTTTATCA CCTTTAAAGG 


AAGAACGCGT 


10500 




TGAAGGCACA 


GATTTAGTTA 


TAGTCCGTGA ATTGACAAGT GGTATTTATT 


TTGGAGAACC 


10560 




TAGACATTTT 


AATAATCACG 


AGGCCTTAGA 


TTCTCTTACT TATACAAGAG 


AAGAAATAGA 


10620 




ACGCATTGTT 


CACGTAGCAT 


TTAAATTGGC 


CGCTTCAAGA CGAGGAAAAC 


TAACATCAGT 


10680 




TGATAAAGAA 


AATGTATTAG 


CTTCTAGTAA 


ATTGTGGCGC AAAGTCGTAA 


ATGAAGTAAG 


10740 




TCAATTATAT 


CCAGAAGTAA 


CAGTAAATCA 


CTTATTTGTT GATGCTTGTA 


GTATGCATTT 


10800 


30 


AATCACAAAT 


CCAAAACAAT 


TTGACGTCAT 


CGTATGTGAA AACTTATTTG 


GCGATATTTT 


10860 




AAGTGATGAA 


GCTTCAGTGA 


TTC CTGGTTC 


ACTTGGTTTA TCACCTTCTG 


CTAGTTTTAG 


10920 


35 


TAACGATGGT 


CCAAGATTGT 


ATGAGCCTAT 


TCATGGATCA GCACCAGATA 


TTGCAGGTAA 


10980 




AAACGTTGCC 


AATCCATTTG 


GAATGATTCT 


ATCTTTAGCG ATGTGTTTAC 


GTGAAAGCTT 


11040 




AAATCAACCA 


GATGCTG CAG 


ATGAATTAGA 


ACAACATATT TATAGCATGA 


TTGAACATGG 


11100 


40 


GCAAACGACA 


GCAGATTTAG 


GCGGCAAATT 


GAATACTACT GATATTTTCG 


AAATTCTATC 


11160 




TCAAAAATTG 


AAT CACTAAG 


GGGGAGATGT 


AAATGGGTCA AACATTATTT 


GACAAGGTGT 


11220 




GGAACAGACA 


TGTGTTATAC 


GGGAAATTGG 


GCGAACCGCA ACTATTATAC 


ATTGATTTAC 


11280 


4= 


ACCTTATACA 


TGAAGTTACT 


TCTCCTCAAG 


CATTTGAAGG ACTTAGGCTT 


CAAAACAGAA 


11340 




AATTAAGACG 


CCCAGATTTA 


ACATTTGCAA 


CACTCGATCA CAATGTTCCT ACTATTGATA 


11400 




TATTCAATAT 


TAAAGATGAA 


ATTGCAAACA 


AACAAATCAC AACATTACAA 


AAAAACGCCA 


11460 


50 


TAGATTTTGG 


GGTGCATATT 


TTTGATATGG 


GTTCTGATGA ACAAGGTATT 


GTTCACATGG 


11520 




TAGGACCTGA 


GACAGGACTT 


ACACAGCCTG 


GCAAGACAAT CGTTTGTGGT 


GACTCTCACA 


11580 
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AACTCAAACG 


CTATGGCAAA 


CAAAACCCAA 


AAACTTAAAA 


ATCGATATTA 


11700 






ACCAACAGGC 


GTCTATGCTA 


AGGACATTAT 


TCTGCATTTA 


ATT AAAAC GT 






ATGGTGTTGA 


CTTTGGTACA 


GGCTATGCTT 


TGGAATTTAC 


TGGCGAAACA 


ATTAAAAACC 






TTTCAATGGA 


TGGTCGAATG 


ACTATTTGTA 


ACATGGCTAT 


CGAAGGTGGT 


GCCAAATACG 






GCATAATCCA 


ACCTGATGAT ATAACATTTG 


AATATGTTAA 


AGGGAGACCA 


TTTGCCGATA 




w 


ACTtCGCTAA ATCAGTTGAT AAGTGGCGTG AgCTATATTC TGATGACGAC GCGATATTTG 






ATCGTGTAAT 


TGAACTTGAT 


GTTTCAACAT 


TAGAACCACA 


AGTGACATGG 


GGAACTAATC 


12060 


15 


CTGAAATGGG 




AGTGAACCAT 


TCCCTGAAAT 




AACGATCAAC 


12120 




GTGCGTATGA 


TTATATGGGG 


TTAGAA C CAG 


GTCAAAAAGC 


TGAAGACATC 


GAC TTAGGGT 


12180 






CGGTTCATGT 


ACAAATGCTA 


GACTATCAGA 






12240 


20 


TTGTTAAAGG 


AAATAAAGTT 


CATC CAAATA 


TTACAGCTAT 


TGTCGTACCA 




12300 




CAGTAAAAAA 


AGAAGCAGAA 


AAATTAGGTC 


TAGATACTAT 


CTTTAAAAAT 


GCAGGATTTG 


12360 




AATGGCGTGA 


ACCAGGATGT 




TAGGCATGAA 


TCCTGACCAA 


GTACCTGAGG 


12420 




GCGTACATTG 


TGCATCTACA 


AGTAATCGAA 


ACTTTGAAGG 


ACGACAAGGC 


AAAGGTGCAA 


12480 




GAACACATTT 


AGTATCCCcT 


GCTATGG CAG 


CAGCAGCAGC 


TATTCATGGT 


AAATTTGTGG 






ACGTAAGAAA 


GGTGGTTGTT 


TAAATGG CAG 


CAATCAAACC 


TATTACAACA 


TATAAAGGTA 


12600 


30 


AAATAGTCCC 


TCTCTTCAAC 


GACAATATCG 


ATACAGACCA 


AATCATTCCT 


AAGGTACACT 


12660 




TAAAGCGTAT 


TTCAAAAAGT 


GGCTTTGGTC 


CATTTGCTTT 


TGATGAATGG 


CGGTACTTAC 


12720 




CTGATGGTTC 


AGATAATCCT 


GATTTCAATC 


CTAACAAACC 


ACAATATAAA 






35 


TTTTAATTAC 


TGGAGATAAT 


TTTGGATGTG 


GTTCAAGTCG 


TGAACATGCT 


GCTTGGGCT C 






TTAAGGACTA 


TGGTTTTCAT 


ATTATTATTG 


CAGGAAGTTT 


CAGTGACATA 


TTTTATATGA 




40 


ATTGCACTAA 


AAATGCGATG 


TTGCCTATCG 


TTTTAGAAAA 


AAGTGCCCGT 


GAACATCTTG 






CACAATATGT 


TGAAATTGAG 


GTCGATTTAC 


CAAATCAAAC 


TGTGTCATCA 


CCAGACAAGC 






GTTTCCATTT 


TGAAATTGAT GAAACTTGGA 


AGAATAAACT 


TGTAAATGGC 


TTAGATGACA 




45 


TTGCAATCAC 


CCTACAATAT 


GAATCATTAA 


TAGAAAAATA 


TGAAAAATCa 


CTTTAAGGGA 


13140 




GTTGAATATT 


ATGACAGTCA 


AAACAACAGT 


TTCTACGAAA 


GATATCGATG 


AGGCATTTTT 


13200 




AAGACTTAAA 


GATATTGTCA 


AAGAAACACC 


TTTACAATTA 


GACCATTACT 


TATCTCAAAA 


13260 


50 


GTATGATTGT 


AAAGTCTATT 


TAAAACGAGA 


AGATTTACAA 


TGGGTACGTT 


CTTTTAAATT 


13320 




AAGAGGTGCT 


TACAACGCTA 


TTTCTGTTTT 


AT CAGATG AA 


GCTAAAAGTA 


AAGGTATTAC 


13380 
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AAACGCTGTT 


' ATCTTTATGC CAGTCACTAC ACCTTTACAA AAGGTAAATC AAGTAAAGTT 


13500 




CTTTGGAAAT AGTAACGTTG AAGTTGTACT CACTGGTGAT ACATTTG AT C ACTGTTTAGC 


13560 




TGAAGCTTTA 


ACTTATACAA GTGAACATCA AATGAACTTT ATAGATCCAT TCAATAATGT 


13620 




TCATACAATT 


TCTGGACAAG GTACGCTTGC TAAAGAAATG CTAGAACAAG CAAAGTCTGA 


13680 






TTTGATTATC TATTTG CCG C AATTGGTGGT GGCGGTTTAA TTTCAGGTAT 


13740 


10 




TTTAAAACCT ATTCACCTAC CACGAAAATT ATAGGTGTTG AACCTTCAGG 


13800 




TGCAAG TAGT 


ATGTATGAAT CTGTTGTGGT AAATAATCAG GTAGTCACAT TGCCTAATAT 


13860 


15 


C G A T AAATTT 


GTGGACGGTG CATCTGTAGC TAGAGTTGGC GATATTACAT TTGAAATTGC 


13920 


AAAAGAAAAT 


GTAGATGATT ACGTTCAAGT AGATGAAGGT GCAGTTTGTT CTACGATTTT 


13980 




AGATAT GT AT 


TCAAAACAAG CAATTGTAGC AGAACCTGCT GGCGCATTAA GTGTAAGTGC 


14040 


20 


GCTTGAAAAC 


TATAAAGATC ATATTAAAGG TAAAACAGTG GTTTGTGTCA TTAGTGGTGG 


14100 




TAATAATGAT 


ATTAATCGAA TGAAAGAAAT TGAAGAACGT TCATTACTAT ACGAAGAAAT 


14160 




GAAGCATTAC 


TTTATCTTAA ATTTCCCTCA ACGTCCAGGT GCATTGAGAG AATTTGTAAA 


14220 


25 


TG AC GTATTA 


GGACCTCAAG ACGATATTAC TAAATTTGAA TACTTAAAAA AATCTTCTCA 


14280 






ACTGTCATTA TTGGTATTCA ACTTAAAGAT CATGATGATT TAATACAACT 


14340 






GTAAAtCATT TCGATCCTTC CAATATTTAT ATTAATGAAA ATAAGATGTT 


14400 






TTAATTTAAC ACATAGTAAG AAAAACAGTC ATAAATTGAT TTCTAATTGA 


14460 






TGACTGCTTT TTATTATACT TTACATTTCT CGTTTCGTCA GATTCAAACG 


14520 


35 


TTTTCACTT C 


GCCAAGCCAT CTTTCTTTGT GTTTGCTTTT aTTTTGACGT TTTAGACATA 


14580 




CCTTGCGGTC TCAATGCGGC TCATCGCATC CACTTTTTGC CTGGCAACGT 


14640 




CT W 


CGGAACGTAA GTTCGaCTAC CATCGACGCT AAGGAGCTTA ACTTCTGTGT 


14700 


40 


TCGGCATGGG 


AACAGGTGTG ACCTCCTTGC TATAGTCACC AGACATATGA ATGTAATTTA 


14760 




TACATT CAAA 


ACTAGATAGT AAGTAAAAGT GATTTTGCTT CGCAAAACAT TTATTTTGAT 


14820 




TAAGTCTTCG 


ATCGATTAGT ATTCGTCAGC TCCACATGTC ACCATG CTTC CACCTCGAAC 


14880 


45 


CTATTAACCT 


CATCATCTTT GAGGGATCTT ATAACCGAAG TTGGGAAATC TCATCTTGAG 


14940 




GGGGGCTTCA 


TGCTTAGATG CTTTCAGCAC TTATCCCGTC CACACATAGC TACCCAGCTA 


15000 




TGCCGTTGGC 


ACGACAACTG GTACACCAGA GGTATGTCCA TCCCGGTCCT CTCGTACTAA 


15060 


50 


GGACAGCTCC 


TCTCAAATTT CCTACGCCCA CGACGGATAG GGACCGAACT GTCTCACGAC 


15120 




GTTCTGAACC 


CAGCTCGCGT ACCGCTTTaA TGGGCGAACA GCCCAACCCT TGGGACCGAC 


15180 
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GTGGAACTT 

(2) INFORMATION FOR SEQ ID NO: 103: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 14 051 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 103: 
GTGGCAATAT TTCTAGTTCT CGTTTTGATA AGATTTTAAA AGGATCTGTT GTGTTTG CAG 6 0 

TGTCCTGATT TGAATTAGAT ACAAATTCAT TCACTAAAGA TGTTGTAAGT TTCATAT C T A 12 0 

CATATGTTTC ACCTTTATAT ACAGTTCGAA TAGCTAACAA TAATTGTTCA TCAGGTG CAT 180 

TTTTCAATAT GTAACCTTTC GCACCATTAC GCAACACATG GAACAAATAC TCCTCATCAT 24 0 

CAAACATTGT TAATATTAGT ATTTTAGTTT CAGGAAAACT GTCAGCAATT TTACTCGTAG 3 00 

CGATAAGACC TGACTCACCT GGTGGcATAC TTAAATCCAT TAGTAACACA TCAGGTTTAt 3 60 

ATTC CATTAC TTTTTGGTAA GCTTCGACGC CATCTGCAGC CGTTGCAACA ACTTCCATAT 42 0 

CATTTTGATA ATTTAAAATC ATAGAGAACC CCGTACGGAC AACAGCGTGA TCATCGGCAA 4 80 

TGAC TATTTT CAATTTTATT CCCCCAATGT ATGTTTCAAA TTGGAATGTT CAATGTAACA 54 0 

TTGGTACCCT CACCAATTTT CGTTTCAATA TTGACG CTAC CGCTGACTAA CTCAGCTCGC 600 

TCATTCATTC CATATAAACC GAGTCCAGAA CCTTTAGGCT TAGAACTTGG ATCAAAAC C A 660 

TTTCCCGCAT CTATCACTTC TGCTACCAAA TGGCGCCCAG TTTGACGGAT ACCTACATTT 720 

ATTTCATTTA CATCAGCGTA TTTCAACGCA TTTAAAATAG CTTCTTGCAC TACTCGATAA 780 

ACAACCGTTT CAATATCACT AT CAAAGCGA GTATTTTTAA TATTTGATGT ATATATGATT 84 0 

TTTATTCCAT AATTTTCTTC AAACTGTTTA AAATATGATT TAAAAGCTGC TTCAAGGCCT 900 

AGATCATCCA AAGAAGCGGG TCTTAATTCA ACCGACATAT TACGTATATC ATCAATTAAT 960 

TTAGCGACAA TATATTCAAT ATTTTCTGCG TCTTCCAAAA GCTTAGTTGT ATCTTCTTGA 1020 

TATTTTAATA ATCTCAATTG AACATCTACA TTG AG CATTT CTTGAATCAC ACTATCATGT 1080 

AACTCT CTAG AAATTCGCTT TCTTT CATTT TCTTGGGCTG AGATTGTTTT ACGCATCATA 114 0 

CGTTGTTGAT GCAATTTCTC TTGCTGTTCA ATTTGTGATG AAACATTTTG AAGCGTAAAT 12 0 0 

GCATGAATTC CCCTGTCTTG ATCAATCAAC TGATATGTTG CTGTAAATGG CATCACTTTT 12 60 

TGATCTTTCG TCTT CATAAA TACTTGGAAA TTCGTAGCTT GTACTTGCAT CGATTCTAAG 1320 
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ATCGCATTCG CCACAGCACT GTAATTATCT TCTTCAGATA ATATATCTTT AGCAGCATCA 144 0 

TTCATTGCAA TAATTTTACC GTTATCATCA GCAAAAACTA TCTTTTCGAT TGAATGCTCA 15 00 

TAATATTTTT TCAATAAAGT ATCTAACTGT ATACTGTCCT CATTAATCAT GACTTACACC 1560 

CTAATTCATC TCATTATTTA TCATCATTGA AAATACCAAA CTTACGTTGA ATATCATCAT 1620 

TATCAAATAT TTTTGGTAAA GGACGACCAT CTCTTTGACC AAATAATAGT ACGCCATACA 16 80 

CTTGATTCTT ATACCAAAGC GGCACTGCTA AAACTGCTGT TAATGATTCG CTCAATAAAA 174 0 

TTGGATAGTC AATCTTTTCT TCAGGCCCTA AAGCTAAACC AACATTGGCT ATTACCATAC 18 00 

GCTTTCCTGT TTTCATAACA GTTCCAGCTA ATCCACGACC TTTTCTTAAA ATAATCAATT 1860 

TAAATCGATT ATTTTTATTA CCTGAAACAT AGTGCCATTT TATTGGAGAT GATGGTTTGT 1920 

TAGATTCATA GAAAG CGATT GCCGCAAAAT CATAACCCTC TTCTTTGCGT ATTTTATCTA 1980 

ATGTCT CTTG AAATCTACGA TCTTCAATTA TTGCTTCTGG TGTCAAATCC TTTCACCTCT 2 04 0 

TATGCTTACA CTTTATTCTT ACGGTAAATA ATATATCTGC GATTTATATA TGTCAAAGGT 2100 

ACACTCCAAA CATGCACCAA ACGTGTAAAT GGCCAACAAG CCATAATAGT GAAACCTAAC 2160 

AATATATGCA TTTTAAATGC AATCGGCACA CCACTCATCA ATGACGCATC TGGTTTTAAC 222 0 

ATAAATAATT GTCTAAACCA AATTGATAAT GAAGTTCTGT AGTTAAAGTC TGGATGTTGT 228 0 

AT ATTTG TTA CTAATGTTGC GTAACATCCC ATAAATACGA TAAGTAATAA TAAGAAATTT 234 0 

A CAAAT AT AT CCGACGCTGA ACTTAATCTT CGAATACTTT TCGTAGTAAC ACGTCTCGCT 24 0 0 

GTTAATAAAA ACATCCCTAT CAAAGTTATT ATACCAAAGA TGCTACCAAT ATAAACAGCG 246 0 

CCTATATGAT ATAAATGCTC AGACACACCC ACTGCATCCA TCCATGGTTT CGGTATTAAC 252 0 

AATCCAACTA CGTGTCCAAA AAACACTGGA ATAATACCTA AGTGAAATAA TAAACTTCCC 2 5 80 

CACATCAACC TTTTTCTTTC TATTAATTCA CTAGATTTAG CTGT CCAAGA AAATTTATCA 26 4 0 

TAACGATAAC GTG CAATATG ACCTGCGACA AAGACAACTA AACATAAATA CGGAAATATA 270 0 

ACCCATAAAA ACTGATTAAG CATGATGTTT CACTCCTTTT GGTGATGTCA AACATAATTT 276 0 

CAATGTTTTT CTAAGTGCTT GAATCACATA GGCATATGGA TTGTTATCTT CACCAAGTGC 2820 

ATTCGCCATC ACATATGTTC CATCCTCAAT AATCATAATG ATTAATTGAA TATTCTCTTC 28 80 

AGCTCTTGGA TCATTTCGCC ATTCTGCCAC TTGCAAAAAT TGAAGCATCA ACGGTAGATA 2 94 0 

ATCAGAAAGT TCATTATCTA CCATTTCTAG TCCAAACATT TCATATAATA CCTTTAATTT 3 000 

AGCTAACATT TGCCCACGTT CTTTTTGCGT AT CAAATTTG TTATACGTCA TATATAATGG 3 060 

TGCTTTTTTC GTAAAATCAA ATGTATCTGT ATAAATCGCT TTGATTTCTG ATAATGAAAA 312 0 
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TGTTTCTTCA AAAGTTTTTG GATGAAAAGT TAATTTTTCT GGAAAACATA ACTGTTGTGC 32 4 0 

CATATATCCA AAACTTTCTT GATATTTTTT AAAATTATCG AAATTAATCA CGGAAAATCC 3 3 00 

CTCCATAGAA ATTCTCATTA TAAATTTCTT GACCAGTTTT CCCTGAACCT ACTGCAACGC 33 SO 

CACAGCCTTC ACAGTTATCT CCAAAATGCT CGCCGCCGTA ATTGTATCCT GTACTACCTT 34 2 0 

GTGCGTGATA CGTATCTAAA TAGGTTTCTT TGTGTGATGT TGG AATAA C A AATCGATCTT 34 80 

CATATTTGGC TAGTCCTAAT AAACGATACA TGTCTTTAGT TTGGCGCTCG GTTATACCTA 3 54 0 

ATCG CTCTAA TCGAGACGTG TCAAATGGCT GTTGAGTAAC TTGAGATCTC ATATAACTTC 3 60 0 

TCATCATTGC CATACGTTGT AGGGCTCCTT TTACTGGCTC TGTATCTCCT GCAGTGAAAA 3 66 0 

TATTAGCTAA GTATTCAATA GGTAAACGCA TTTCTTCAAT GGCTGGGAAA AT CG CAT CTG 3 72 0 

GATTTTGAGT TGTATTTTTA CCTTCAAAAT AGCTCATAAT TGGGCTAAGT GGTGGGCAAT 378 0 

ACCAAACCAT CGGCATCGTT CTAAATTCAG GATGTAACGG AAATGCAAGT TTATATTCAA 3 84 0 

TTGCTAACTT ATAAATTGGA GAGTTTTGTG CAGCTTCAAT CCAATCGTAA CCAATACCAT 3 90 0 

CTTTTTCAGC TTGAGCAATG ACTTCTTCGT CAAATGGGTT TAAGAATATA TCTAATTGTT 3 96 0 

TTTCATATAA ATCTTTCTCG TCTACTG CTG AAGCTGCTTC ATGAACTCGA TCTGCATCAT 4 02 0 

ATAATAAAAC ACCTAAGTAA CGCATACGTC CTGTACAAGT TTCAGAGCAT ACCGTAGGCA 4 08 0 

TACCCGCCTC GATTCTCGGG AAACAGAAAG TACACTTTTC AGCTTTGTTC GTTTTCCAAT 414 0 

TGAAGTAAAC TTTCTTATAT GGACAACCTG TCATACAGTA ACGCCATCCA CGACATGCGT 4 20 0 

CTTGGTCAAC TAATACAATG C CATCTT CAT CACGTTTATA CATAGCACCT GAAGGACACG 42 60 

ATGCAACGCA ACTTGGATTC AAGCAATGTT CACATAAACG TGGTAAATAC ATCATAAAAG 4 3 20 

TTTCGTCAAA TTGGAATTTA ATATCTTCTT CTATTTTTTG GATGTTAGGA TCTTTTGGAC 4 38 0 

CTGfAACATG ACCACCTGCT AAGTCATCTT CCCAGTTAGG TCCCCATTCA ATTTCAATGT 444 0 

TATCCCCCGT AATTTCTGAA TACGCTCTAG CAACTGGCGA ATGCTTCCCT GATTTCGCAG 4 500 

TTGTTAAATG TTCATAATTA TAGTTCCATG GCTCATAATA ATCTTTAATT AATGGCATAT 4 560 

CTGGGTTATA AAAAATTTTA CCTAAAGCAA TTTTTGAAAT TCTACTTCCA GATTTTAATT 4620 

CAAGTTTCCC TTTACGATTT AGTACCCAAC CACCTTTGTA GTGTTCTTGG TCTTCCCAAC 4 6 80 

GTTTCGGATA CCCTACACCT GGCtTCGTTT CTACGTTGTT GAACCACATG TACTCAGCAC 4 740 

CTGGACGATT TGTCCaAGTG TTTTTACATG TCACACTA CA CGTATGGCAT CCTATGCATT 4 8 00 

TATCTAAATT TAATACCATC GCAAcTTGCG CTTTAATCTT CAAGCCAATT AACCTCCTTC 4 8 60 

ATCTTTCTAA CTGCTACATA TAAATCCCTT TGGTTCCCAA TTGGTCCATA ATAATTAAAG 4 9 20 
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GGCGCGTTGT 


GTGAACCACC ACGTGTATCT GTAATTTCTG 


ACCCAGGCGT 


TTGAATATGT 


5040 




TTATCTTGTG 


CATGATACAT AAACATTGTA CCTTTAGGCA 


TACGATGCGA 


AATAACTGCT 


5100 




CTTGCCGTTA 


CAACACCATT ACGG TTATAC ACTTCTAGCC 


AATCATTATC 


TTGGATATCG 


5160 




TGTTTTTCAG 


CATCTTCATT TGATATCCAA ACCGTTGGAC 


CACCTCTAAA 


TAGTGTCAAC 


5220 




ATATGCTTAT 


TATCTTGATA CATTGAGTGT ATATTCCATT 


TTCCATGAGG 


CGTTAAATAA 


5280 




CGCAgTACCA AAGCATCTGT ACCACCTTTA ATTTTCTTAT 


CTCTATTCCC 


AAATACCATT 


5340 






TCGGTTTATA TACTGGTAAG CTCTCCCCAA 


ATTGTTGGAA 


AACTTCGTGA 


5400 


15 


TC CACATAA T 


AACTTTGACG TCCTGTTAAT GTTCTAAAAG 


GTACTAGACG 


TTCTATATT C 


5460 


GTTGTAAATG 


GTGAATATCG TCGACCTTGT TTATTTGAAC 


CTGGGAATAC 


TGCTGTCGGT 


5520 




ATTACTTCT C 


GTGGTTGTGA AGITATA TTT AAAAACGAAA 


TTTTCTCAGC 


AGCGCGTTCG 


5580 


20 


CTAGAAATAT 


CTTTTAACGG CATTCCAGTT TGTTCTTCGA 


GATCTTCATA 


TGATTTTTGT 


5640 




GATAATTTAC 


CATTCGTAGC AGATGAAATA CTTAGTATTG 


CATCAGCTAC 


ATTACGTGCT 


5700 




GTAT CAATAC 


GTGGACGATT CGCTCTCACA GAATCATCAT 


TTGTATCACT 


CCACGTACCT 


5760 




AACATACTTT 


TTAATTCTTC ATATTGTTCA CTGACACCGA 


AACTTACACC 


ATGTG CTCCA 


5820 




ACTTTCCCTT 


TTTCAAGTAC AGGACCAAGC GTGACATATT 


TGTCGTAAAT 


TTTAGTGTAG 


5880 




TCG CG TTCTA 


CAATTGCAAA GTTAGGCATT GTACGTCCAG 


GTACCGCTTC 


AATTTCACCC 


5940 




TTCGACCAAT 


CTTTCACTAC GCCGTATGGT GTTGAAATTT 


CTTGCTTTGT 


ATCATGACTA 


6000 






TCACAACATC TTTAAACGTT CCAGGTAAAT 


AGTCTTTTGC 


CATTTCTGAA 


6060 






CCAACGTTTT ATAAATATCC CAGTCTGAAC 


GCGATTCCCA 


TAACGGATCA 


6120 


35 


ATGGCAGGAT 


TGAAAGGATG TACATATGGA TGCATATCCG 


TTGATGATAA 


ATCATGTTTT 


6180 




TCATACCAAG 


TCGCTGCCGG CAAAACAATG TCAGAATATA 


ACGGTGTTGC 


CGTCATTCTG 


6240 


40 


AAGTCTAAAG 


AG AC CACTAA ATCTAACTTA CCTGTTGTTT 


CTTCACGCCA 


CGTAATTTCT 


6300 




TCTGGCTTTT 


CATCTTCATT TGGTGTAGCT AATAACCCTG 


ATTTTGTGCC 


AAGTAAATGC 


6360 




TTCATAAAGT 


ATTCTTGACC TTTTGCAGAA CTTGAAATTA AGTTTGAACG 


CCATATAAAT 


6420 


4S 


AATGATTTTG 


GATGATTCTT TTTCAAATCA GGATCTTCTA 


TTGCAAATTG 


TGTTTGTTTT 


6480 




GATTTCACTT 


CATCAATTGC ACGTTGCAAA ATCGCTTCAT 


TTGAATCTAT 


ACC TTCATCT 


6540 




TTAGCTTCTT 


CTG C AAACAA CAAACTATTT TTATTAAATT 


GTGGATATGA 


TGGTAACCAA 


6600 


50 


CCAAGTCTAG 


CTGCTAAAAC ATTATAATCA GCTGGATGTT 


GATGCTTTAA 


CTCCTCTGTT 


6660 




TTAGCTAATG 


GAGATTTTAA ACGATCTACA TTTGACTCTT 


CATATTTCCA 


TTGGTCTGTT 


6720 



ss 
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AATGCGACAG TACTCCATCC TTCAATCGGA CGACATTTTT CTTGTCCCAC ATAGTGAGCC 6 84 0 

CAACCGCCAC CATTCACACC TTGACAGCCA CATAACATAA CTAAGTTTAA GATTGAACGA 6 9 00 

TAAATCGTAT CTGAGTTAAA CCAATGGTTA ATACCCGCAC CCATGATAAT CATTGAACGC 6 960 

CCTTCAGTAT CGATAGCGTT TTGCGCAAAT TCTTTCGCTA CTTGAATGAC AACACTTTGT 70 2 0 

TTTACGCCTG AAATGGCTTC TTGCCAAGCA GGTGTATATT TTGATTCTGC ATCGTCGTAT 70 80 

CCTTTTGATT CTAATTTATG ATCAAAACGA CGCACGCCAT ATTGACTTGC CATTAAGTCA 714 0 

AAAATTG TAG CAATACGGAC TTTGTCACCA TTTGCTAAAG TGACTTGTCG AGTTGGAATT 72 00 

GGACGATTGA ATATCCCATC TCCATCACTA TCAAAGTATG GGAATTGAAT TGTTTCTAAT 72 6 0 

TCGTATCCAC CTTCTGTCAT TGATAATGTA GGGTTAATTT TAGAACCATC TTCTGTTTCT 7 3 20 

AGTTTTAAGT TCCACTTCTT ACCTTCTTCC CAACGTTGAC CCATTGTGCC ATTAGGTACT 73 80 

ACTAAACTAT CGCTGATTGC ATCATGAATA ACTGGCTTCC ATTCGCCTTG CTCTGTTGTT 74 4 0 

TGACCTAAGT CACTCGCTCT TAAAAATCGA CCCGCTTTAT ATCCATTTTC ATCTTCATCC 75 00 

AGCATGATAA GAAACGG CAT ATCTGTATAT TGTTTAGCGT AATTTATAAA GCGTTCATTA 756 0 

GGTTGATTAA CATAATGTTC TTGTAAAATA ACATGCGTCA TTGCTTGTGC AATTGCAGCA 7620 

TCTGAACCAG GATTCGGTGC TAGCCAGTTA TCTGCAAATT TCACATTTTC TGCGTAATCT 76 8 0 

GGTGCTACTG AAATGACTTT TGTACCTTTA TAGCGGACTT CAGT CAT AAA ATGTGCATCC 774 0 

GGAGTACGTG TTAAAGGTAC ATTAGAGCCC CACATAATAA TGTATGATGC GTTATACCAG 78 0 0 

TCACTTGATT CAGGCACATC TGTTTGCTCT CCCCAAATTT GTGGAGAGGC AGGTGGTAAA 786 0 

TCTGCATACC AGTCATAAAA ACTAAGCATT TCACCACCAA GCAAATTGAT GAATCGAGCA 7 920 

CCTGCTGCAT AACTAATCAT TGACATCGCT GGAATAGGTG TAAATCCTGC GATTCGATCT 7980 

GG AC CATATT TTTTTATTGT ATACAGTAAT TGTGCTGCGA TTATCTCTGT AACGTCTTTC 804 0 

CAATTTGAAC GCACGTGCCC TCCCATACCT CGGGCTTGCT TATATTGTTT GGCTTTGTCT 8100 

TCATTTTCAA CAATAGACGC CCATGCAGCA ACGCGATTAC CATTGTTTTC TTCTAATGCT 8160 

TCAGTCCATA AATCCCAGAG TTTTCCACGA ATATATGGAT ATTTGATTCG AAGCGGACTG 8220 

TATTCATACC AAGAGAATGA CGCACCTCGT GGACATCCTC TCGGTTCATA TTCAGGCATA 8280 

TCCGGACCAC AACTTGGATA GTCAGTTTGT TGATTTTCCC AGGTAATCAC ACCATTTTTC 834 0 

ACAAATAC TT TCCAAGAACA TGAGCCTGTA CAGTTAACAC CATGTGTTGT TCTTACTTCT 84 0 0 

TTATCGTGGC TCCAACGTTC TCTGTACATT TTTTCCCATT CTCTACTTTT ACTTTCTAGG 84 6 0 

ATCGACCAAT TCCCATTAAA TTTTTCTGTT GGCTTAAAGA AATTCAATCC AAATTTTCCC 852 0 
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TAAAATGCCC AAGACTATTG CTTTAATTAG ATTGTACATT TTTTCACAAA CATAAAATAT 864 0 

TAGGGAATCA CCTAATTACT TAAGGAATTT CCCTATCAAT AACGGGATTT CATTGAAATA 870 0 

ATACACAATC ATGTATGGTC ATGCTTATTG CCAATCTAAA TCGTT CAAAT TTGGCACAAC 8 760 

GACAAATAAG GCTTCAACAC GAATATATTC TCTCGGTTGA AAC CTTACTT ATTCATTTAT 8820 

TTTTTATAAA TTAGTGACAT AACACTGTAT TAGCATCTGC ACGATCGGTT GAAATATATG 88 80 

TTACATTTTC TTGCTGCTTA ATAAATGCAT CATAGTAATC ATATTGCGAC GAATGATATG 8 94 0 

TGCCATTCGA TGTATCATTT GGGTTTAGCA AACAGCCATA ACCTTCGTCA TATAAATGTT 9 0 00 

CACAGAGCAT AAGGGCGTCA TGTTTAGAAC CACTTACTAC ATAAAATTGC TT CAT AGGAT 9 0 60 

CATATGATTT AGGAGTGTTT TCAGTATAAT CAACAACTTC CCCTATAATA CATATAC CTG 9120 

GTTTCGCCTC AATTGAATAG TGTTG CAATT TTGAAATAAT ATTACTTAAA CGCCCCTTAA 9180 

CAACAAACTC GTTAAAACAC GATG C TTGAA AGACAATCGC TATCGGGTAA TCAATATCTG 9240 

TGTATTGTTG TATCTGTGTG ATAATTTTCC CTAAACGTTT TACCCCCATA T AAATTG CTA 93 00 

ACGTGCCACC ATTCACTAAG GAATTGACAT CCACTTCATT TTCTTCTGAA T CTTTAAAGT 936 0 

GACCTGTAGA AAATGTCACA CTTTTAGCAA CTGTACGCAT TGTCAAACCT GTCTGCATAG 94 20 

TAGCAACTGc tGCGCTCGCT GATGTCACCC CTGGTACAAT TTCAAACGCA ATATGATGTT 94 8 0 

CATTTAGTAT GTCGACTTCT TCTTG CACAC GAC CAAAT AT CGCTGGATCG CCACCTTTAA 954 0 

GTCTAACAAC CTTGTTATAT CGACGCGCTG CTTCCACGAT ACAGT CATTT ATTTTTTCTT 96 0 0 

GCTGAATATG TTTTGCATAC GGCTTTTTAC CAACATCGAT AATTTCAGTA GTCAAATTCG 966 0 

CATATTGTAA AATTAACGGA TTCACTAATC GATCATATAG AATGACATCC gCTTCACGTA 972 0 

TTAAACGCTC AGCCTTTTTC GTCAAATAAT TCGGATTACC TGGACCCGCA CCTATCAAGT 97 8 0 

AAACCTTGCC ATATTCCTCT ACAGACATAT ATATACGTTC CCGTCTGTAA CTTCTACCTC 984 0 

ATAAACATCT ACACAACCTT CATCAGGTTC TTGAACAATA CCTGTATTTA AATCAATTTT 990 0 

TTGATCGTGG AGCGGGCAAA ATACATATTC CCCACTCACT GTCCCTTCAG ACAATGGTCC 9960 

TTGTTTGTGT GGACAGATAT TGTGAATCGC ATGAATTTTG CCACTTTCTG TTAAAAACAA 10020 

CCCTACCTCT TTGCCTTTGA CAATAACCTT TTTTCCAATT AGGGGTG TT A ATTCATCTAT 10080 

AGTTGTCACT TTAATTTTTT CTTTTGTTTC CATGTATTAC ACCTTCTCCA CTTCAAAAAT 1014 0 

TCTACGTGCT TGAGCATTGC TAGTTATTGC TTCCCAAGGT TCAGCTTCGA CTGCTTTTTT 10200 

AGCATCCATA ATGCGTTCAA ATAGTTCATT TTGTCTTTCT GGGTCAAGTA AGACTTCTTT 10260 

TACATTTTCA AATCCAAGTC TTCTTAACCA TGGCGCTGTT CTTTCAGCAT ATATACCTGT 1032 0 
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AGTTG TTAAA AATTCAGCTT TTTCAACTTC TGTACCACCA TTACCACCGA TATAGATTTG 10440 

GAATC CATTT TCAACTGAGA TAATACCAAA ATCTTTAACA CCTGATTCAA CACAACTTCT 10 500 

TGGGCAGCCT GATACACCCA TTTTGAATTT ATGAGGTGTA TCGATGTATT CAAATGTTTT 105 60 

TTCTAAACGA ATGCCAAGTC GTGTCGTGTA TTGCGTACCA AATCGACAAA ACTCTTTACC 106 20 

AACACAGCTT TTAACTGAGC GTGTTTT CTT ACCATAAGCT GATGcTGAAC GCATACCTAG 10680 

GTCTTCCCAT ATATTTGGTA ATTCTTCTTT TTTAACTCCA TACAAACCAA CACGTTGTGA 10740 

ACCTGTCACT TTAA CTAGTG GCACATGATA TTTCTTAGCC ACTTCTCCTA GACGAATCAG 10800 

TTGGTCTGCA TCTGTAACAC CCCCACGCAT TTGAGGTATA ACAGAAAATG TACCATCATT 10860 

TTGAATATTC GCATGGTAAC GTTCGTTAGC AAATCTTGAT TCTCTTTCAT CTT CATGATC 1092 0 

ATGTGGATAA ACCATGTTTA AATAATAGTT GATTGCTGGT CGACATTTTG GACATCCACC 10980 

TTTATTTTTA AAGTTTAAAA CATGTCGAAC TTCTTTAGAT GTTTTTAAAC CTTTCGCTCT 11040 

TATTTGCGTT ACTATTTGAT CGCGTGTCAA ATCAGTACAA CCACATATAC CAGCAGGTTT 1110 0 

TGCGGCAACA AAGTCATCTC CTAAGGTGTG CTGCAATATT TGAGCAATTT GCGGTTTACA 1116 0 

TTTACCACAT GAATTCCCCG CTTTTGTTTT AGCCGTTACT TCTTCAACTG TTGTAAAGCC 1122 0 

ATTTTCCGTA ATCGCATTTA CTATAGTACC TTTATCAACA CCATTACAAC CACAAATTGT 11280 

TTCATCATCA GCCATATCAG CAATTGATAG CGATGCCTCT TCTCCACCTT TAGTAAGCAA 1134 0 

TGATACAAGT GTGTAATCTT CAGTGGATTC ACCTTTTTTC ATCATGTTAT AAAAGCGTGA 114 0 0 

ACCATCATCG ATATCACCAT ATAGTACTGC ACCAACTACA TTACCGTCTT TTAAAAAGAT 114 60 

TTTTTTATAG TTATTATCAA CACTATTAAA TATTTCAATA CCTTTAATTT CTGCATTTTC 11520 

TACAATTTGA CCAGCACTAT ACAAGTCACA CCCAGAAACT TTTAATGACG TAAATGTTGT 11580 

TGATCCCTTG TATCCGTTCG TTTCTTTATT TGTTAAATGA TCAGCTAATA CTTTACCTTG 1164 0 

TTCATATAGT GGTGCAACGA GTCCATAAAC TTTGCCGTTA TGTTCTGCAC ATTCACCAAC 11700 

TGCATATACA TTGCTATCAC TTGTTTG CAT CACATCATTG ACAACAATAC CACGATTAAC 11760 

ATCTAGACCT GATT CTTTGG CTACTTCTGT GTATGGTCGT ATACCTACTG CCATAACAAC 11B20 

TAAGTCTGCC GGAATCTCGC GTCCATCAGC CAATTTAACA CCCTCAACAT CATCTTCTCC 11880 

TAAGATTTCA GTTGTGTTGG CTTGCATTTC AAACTTCATA CCTTGCTTTT CTAGATCTGC 11940 

TTTAAGCATA TTTCCAGCTT TACGGTCTAG TTGCATTTCC AT CAAC CATT CAGCTAAATG 12000 

TAACACCGTT ACTTCCATAC CTTGATCTAA TAAACCACGT GCACACTCTA AACCTAGTAA 12 060 

TCCTCCACCA ATTACAATTG CTTTCTTTTT AGTCTTAGCA ATG TTCATCA TTTGTTCAGT 12120 
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GAATGCTTTA GAACCTGTCG 
AGTAGTAACT GATTGATTTG 
GATACCATGT TCCTCATACC 
ATTTTGTAAA ATATTTGAAA 
TACCGTAATA TCATATAAAT 
CGCCATACCG TTACCAATCA 
CCATAATATT TATTTCAAAA 
GGAATCATTA AGCTTTCTAA 
ATTGAAGGTG TGAAGTGTAT 
TTGTTAACAA GTCTTCCGTC 
TTCGAGATGC TTTCTAAATC 
GTCGGCTTGC TAATTTGCAA 
AACTTTCCAT TAATATTGCC 
GCTAATGCGT CACAAATACG 
GGCTCGCTTA CTTCTACCTT 
GGTATATCCT TGAGATAATG 
TCAACCCCAC TTTGAATCaA 
AAAAACGCAA TATCATAGTG 
AACGCTTGaT TCTGTCGTCC 
TTTACCAACC CTTTCACACG 
CATTATAATG TAAAATCAGG 
TTTTCCCTTT TTGTTAAATC 
TTTGAGCAAG CATTAATATA 
TTGGCCTAAT ATTGTTTCGT 
TAAATCGCCA TCATCATTTT 
TTTAAGTAAC CACGGATGCA 
CGTATCTCGC AAAAATGCTT 
TTCATACTCA GGATTTGTCG 
ACTTCCCCAA GGATATCTAA 



CAAAAATCAA 
CTCTATCTAC 
ACT CATATGG 
GCATGATGCG 
CGTTGGCGCG 
TTACTAGTTT 
AAAGGTATTA 
TCTATCGTTA 
AT CTGTATTA 
ATATAAAAAT 
ATGTGTAAAA 
ATTTTGAGCG 
GTGTGCAACA 
TTGTTCAATT 
TATGTCTGGA 
CATTG CACTA 
CGTCGTCaTT 
ATGTATATCA 
GTGCCTCATG 
TATTGTATAC 
GAATTC CCTG 
AAAAAAAGCG 
TCGGTCGCTT 
CAAAGCGCTC 
CATGTTCGCT 
ATCTTGCAGA 
CTTCAACATA 
CAAACCACCA 
CCGTAATCGT 



TTTATCGTAT 
TTCAATTACA 
ATTCATAATT 
GTTATAGTTT 
CTCTAATATT 
TTGCTTTGCC 
ATTTTTCGTT 
ATGATTTGCT 
ATAACCATGT 
AATGGTACGA 
CTAATCT CTC 
CATATTTGTA 
ACCATAACTC 
AATCGTCTCA 
TACCGTCGTT 
AAGATTAGCA 
ACCGTCTCTA 
TCTTTTACTA 
CCATGTGCAA 
CAAATCATTT 
ATGCCTGTAG 
ACCGATATAT 
GTAGTGTATA 
GGGTATCAAT 
GTATATTTCA 
TGTACCTAAA 
AGTAAGTAAT 
GACAAAAGGA 
AGATATAATT 



GATACTTCAA 
GGAT CATTTG 
GTTTCTTCAA 
GGATAAGGTT 
TCTTCGATTG 
ATAAAATATG 
AGTGCTTTTA 
TTAAAATTGG 
CATT CATTTG 
CAATCAATTT 
CATATAGCGT 
ACTCTTCGTG 
CAACTTGTTG 
TTAAAGGATG 
TCATTTCATG 
ATGGTACAAT 
AATCCtGATG 
ATTCAGAAAT 
CAATGATATT 
TGTTTTTGTG 
TCATGCATAT 
GAATCCCTAC 
TTATTATCTT 
ACTTTGCGCA 
TAACCTCTTT 
GTAACTGCCG 
TGGCTACCAT 
TAACCCGAAA 
TCATCATCAA 



TACCATTTGC 
TAATTAACTC 
CTGTCATTTT 
CTTTACCTAT 
TTCGAATGCC 
CCCCTTTACT 
TATTTTCATT 
GTCGAAGTTA 
CTGCTTCACT 
TTGATACCGT 
TCTCGCATAT 
TGCCTTAGTA 
TTCGTCACCT 
TGTGCCAAGT 
AACGATATTC 
TTTAAAATGG 
CTCACTTTCt 
AAATGCTTCT 
CCCATTCACA 
AAAAGAATCA 
TCCTTATACA 
TCAACATTTA 
AAAATGGTGG 
TGATCACACC 
TTTCATAAAT 
CTGACTTTAA 
AGCCTTTCCC 
TACTTTTCAC 
TTGTCATGAC 



12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
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CCAATCAATA CCTAGTTCTC TTAGAgGCGT AAATGCTTCA TGCATGAGTT CTTGCAATTT 
TTCTG CATCT T 

(2) INFORMATION FOR SEQ ID NO: 104: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1885 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



14040 
14051 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 104: 

TAATCCTCAA CTTnGATTAT ATGGCTTGGG CGCATATGAA CTGCTTAGTT TAGTGTATGA 6 0 

CATTCATACA GTTCGCATGA CTATCATACA ACCTCGAATA GATAACT TTT CTACTGAAGA 12 0 

GTTACCAATC TCAAGATTAC TTCAATGGGG AACCGATTTT GTTAAACCCT TAGC CAGACT 18 0 

TGCTTATAAC GGTGAAGGTG AGTTTAAAGC AGGTAGTCAT TGTAGATTCT GTAAGATAAA 24 0 

GCATTCATGT AGAACACGTG CAGAATACAT GCAAAATGTG CCTCAAAAGC CACCACATTT 30 0 

GTTGAGTGAT GAAGAGATTG CAGAACTTTT ATATAAACTG CCTGATATCA AAAAATGGGC 360 

TGATGAAGTA GAGAAATATG CGTTAGAACA AGCGAAAGAG AATGATAAAA CGTATCCAGG 420 

TTGGAAGCTA GTCACGGGAC GTTCAAGGAG AGTGATAACT GATACAAAAG CAGTCCGAGA 4 80 

CAGGTTAGTT GAAGCGGGTT ATAAAC CTGA AGATATTACA GAAACCAAGT TACTTAGCAT 54 0 

TACGAATTTA GAAAAATTAA TCGGCAAAAA AGCATTTTCT AAAATTGCAG AAGG CTTT AT 600 

AGAAAAGCCG CAAGGTAAAT TAACACTTGC TACCGAGTCT G ATAAAC G AC CAGCTATAAA 66 0 

GCAATCTGCT GAAGATGATT TTGACAAACT ATAAAAATTA AAAAGGACGG TATATAAACA 720 

TGAAAGCAAA AGTATTAAAT AAAACTAAAG TGATTACAGG AAAAGTAAGA GCATCATATG 780 

CACaTATTTT TGaACCTCAC AGTATG CAAG AAGGGCAAGA AGCAAAGTAT TCAATCAGTT 84 0 

TAATCATTCC TaAATCAGAT ACAAGTACGA TAAAAGCCAT TGAACAAGCT ATAGAAGCTG 90 0 

CTAAAGAAGA AGGAAAAGTT AGTAAGTTTG GAGGCAAAGT TCCTGCAAAT CTGAAACTTC 960 

CATTACGTGA TGGAGATACT GAAAGAGAAG ATGATGTGAA TTATCAAGAC GCTTATTTTA 1020 

TTAACGCATC AAGCAAACAA GCACCTGGTA TTATTGACCA AAACAAAATT AGATTAACGG 1080 

ATTCTGGAAC TATTGTAAGT GGTGACTATA TTAGAGCTTC AATCAATTTA TTTCCATTCA 114 0 

ACACAAATGG TAATAAGGGT ATCGCAGTTG GATTGAACAA CATTCAACTT GTAGAAAAAG 1200 

GCGAACCTCT TGGCGGTGCA AGTGCAGCAG AAGATGATTT TGATGAATTA GACACTGATG 126 0 
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TTGAGGTGTC AAGAATTTGA AATTTATGAA TATAGATATT GAAACATACA GCAGTAACGA 13 8 0 

TATTTCGAAA TGTGG TGCCT ATAAATACAC AGAAGCTGAA GATTTCGAAA TTTTAATTAT 14 4 0 

AGCTTATTCG ATAGATGGTG GAGCGATTAG TGCGATTGAC ATGACTAAAG TAGATAATGA 15 00 

GCCTTTCCAC GCTGATTATG AGACGTTTAA AATTGCTCTA TTTGACCCTG CTGTAAAAAA 156 0 

GTATGCATTC AATGCTAATT TCGAAAGAAC TTGTCTTGCT AAACATTTTA ATAAACAGAT 16 2 0 

GCCACCTGAA GAATGGATTT GCACAATGGT TAATTCAATG CGTATTGGCT TACCTGCTTC 16 8 0 

GCTTGATAAA GTTGGAGAAG TTTTAAGACT ACAAAGCCAA AAAGATAAAG CAGGTAAAAA 17 4 0 

TTTAATTCGT TATTTCTCTA TACCTTGTAA ACCAACAAAA GTTAATGGAG GAAGAACrAG 1800 

AAACCTACCT GAACATGATC TTGAAAAAtG GCAACAATTT ATAGATTaCT GTATTCGAGA 18 6 0 

TGTAGAAGTA GAAATGGCGA TTGCT 18 8 5 



20 (2) INFORMATION FOR SEQ ID NO: 105: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2656 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 105: 

30 TAATCCTTAG TTCACTGnCA AATTTCAAAA CACCAGTTCC CTCTATCTGC ATCCATAGAA 60 

ACTGnATGTT TGTGTCAATA ACCGGATTAT ATTGTGATGn TGTTTGTAAC TCGATTAAGT 12 0 

TATCATCTTT CGAAAAATTA TCTACTACCA TT ATT CAAC C ACCTTTCCTT CGAATAAACT 180 

35 

CCATTTACCA ACkCCACCAG TACCAAAGTT TCTAACTAAA AATTGATGTG CAGACGGGAA 24 0 

GTTATTACGT CTTAATACTT GTGTTGTATT ACCTGGTGTA TTCGATTTTA CTTCTAATAT 3 00 

CCAACCTGCA ATAC CTTTAA AGTCTTTAGG AAAATCAGTA AATCGGTTTG ATTCTTCAGT 36 0 

40 

AGTGATATAG AAATCTAAAC CAACGATTTT TAAATCTGAT AATTTTGTAA TACTCTTAGG 42 0 

GATATGTTCC CAATAAC CGG CGTTTTGCGG G CAG AAATT C CATGCTCCGT TGTTTTTCTT 4 80 

45 ATTGAAAATG TCAATGACAC GTTCGAATTT AAG CATATTT CTACCTGTGC TGTTTCTGGt 54 0 

AAGTACTTGT CTTAGAG CAC CATTATAGTG TCCAGGCAGT ACATCCAAGA ACCACCCTGC 600 

ATCTCTAAAC GCTTTCGGTA ACGGGAAATC TAATGCATTT TGTGTGTCTT GaCGTATAGA 660 

50 TATAGTAATG ACCAACTTCC GTAATATCAC TTAGATATGC TGGGTTCTGT ATTGGTAACG 72 0 

GTTTAACACG TCCGCCTGAA TCAGTCATTG ATACTTGAGG TGCGATGTTT TTCAAGAATT 78 0 
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TAGTTACCCC GATTAGAAGT GCTTTACGTC CTGTTTCTAG ATCGTAATAC ATATCTAGAC 9 00 

CCTCAGCCTC TTGGAAATCT CCTTTAAAGT TGTTATTCAC ACCGCCTATA TCGATGCGAC 96 0 

5 GTTTAAATAA CAATTCTTTC GTTTTGATAT CGAAGCCTTG TAAGTAG TTA GGGTTGGCTG 1020 

TATTCGAATC ACCTGTATAC CAATATAAGA TACCTGCATC ATAAGTGATA CCTTGCATAG 1080 

GTTGTGTATC TGAAG TGTAT TCCATAGGTA TATCCATTTG ATACAATACT TTGTCTATAC 114 0 

10 

CTTTATCAAT ATCGTCAGCA CTTCTAACCT CAACAAAGTT CAACGAATTC TTAAGTTGT C 1200 

TTTCAGTGGG TTTATATTCA CGTCTAAAAA T CATTAAATT TTCTACCGGA TTATAAATCG 12 6 0 

CTGACGTATA TCTGTCGTTA AATATATTCG GCATGACATC TTGCATTTCA TTAC CATAAG 1320 

15 

TTATTTCTCC AGTTCTATAT TGGAAACGTA CAAACTTGTT GTTTTTGTTA CTGTCCAATA 13 8 0 

CAGCTGAATA AATC CATAAT TCTCCATCAA TGTATCTATA CGCATTGTGT GTACCGTGAC 14 4 0 

2Q CGCCGTTTTT AACAAGCAAT CTATCAATAA ATTGTCCGTT GGGCTTCAAT CTAGATAACA 1500 

TGTAATGATT ACCTGGACGA GCTTGCGTCA TATAAATAAT TTTCGTTCTA GGGTCTACCC 1560 

AAAATGATTG CATTACTGCA TTTGTATATG GCGATAAATC AGTGATAAAT TCCGGTTCTT 1620 

25 GCTCTTTTGG TTCGAATCGG TATTCTGTCG CTCGATATTC TTTATAGTGT TCATCTACAG 16 8 0 

CTTTCTCAAC CTTTTTAGTG AAAACAT CTA GTGTTGAATA ATCATGATAC AAACGATCTT 174 0 

GCAATGTCTT ATGACCATAA CCTGTATTAT CAACGCGCGC GTCTTTTAcT TCGTTGATAC 180 0 

30 CGTCGCCGTT ATGACCTAGT ACCATGTTGC TAAATCGACC GTTTAAATAT GTTAAAAAGT 1860 

CAGAGACGTT ACTTGTAACA TTTAAATGTT CATACTTTAT TTGTTCTCCA TCATGTGCGA 192 0 

ATACCT CTTT ATTTCTGTGG T ATT CAAGAG AGAAATTAAA ATCCGTCAGC ATGTCTGAAA 198 0 

35 

TAAGTTTAAA GTTATACTCA TTTTCATCTA CATATCTGTA GTCAAAGACT CTACTTAAAT 2 04 0 

CTGTAATTAG TTTATTACTC ATGTTTTCCT CCTTTACTAT CCATAAAACT GATmATAATT 210 0 

TTTAATAAGC TCATACATAA TAACTTCATG ACCTCTTTCA TTAGGATGTA ATCCATCAGG 216 0 

CATGCTAGAT TTTCTAAATG CTGGATTATA TGGTTTGAAA TAATCTGTGT GATAAGCATC 222 0 

ATATACTGGT ACATCCAATT CACTACAAGC CAATATCTGA GCATTGACAT AATCCTCTAA 22 8 0 

4S AGTTAACC CT AGTTTG TTTT TGTCCGTATC TTTACGGCGT ATCGTTGTAC CACTCATAGG 234 0 

GCATTGCCTA GTAGCTGTCA TTACAAGTAT TTTTGAAGCT GGATTATTTT TCCTGATAAC 24 0 0 

TTCAATTGCA GAACAAAAGG CGCCGTAAAA CGTTTTAG TG TCGGTTTTAT CAGTGCCTAT 2460 

SO CGGTACGCCT GCCCAATAAC CATGTAACCA GTCATCATCT GTACCTTGTA ATATGATTAG 252 0 

GTCTCCTCTT ATTTGCTCTG CTTGTCTaTA AATGCTGTTT TCTaCCGCTT CTTTACCTAT 2 580 
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CTTGCCTAAC ATTTCT 

(2) INFORMATION FOR SEQ ID NO: 106: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 4854 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 106: 

AAAATGAGGG TTCTAG CGGA AATTACCAAA AGCGTGGTTC ATACTATGGG CAGCGTAATC 6 0 

GTATTTCAAA AGAAAAAACA CCTAAATGGT TAGaAAATAG AG ATAAAC CT AGTGAAGAAG 12 0 

ATTCGGCTAA AGATAATAGC GTAGATGATC AACAATTAGA GCAAGATCGA CAAGCATTTC 180 

TAGATAAATT ATCTAAAAAA TGGGAGGAGG ACAGTCAATA ATGAAGCAAT TTAAAAGTAT 24 0 

AATTAACACG TCGCAGGACT TTGAAAAAAG AATAGAAAAG ATAAAnCAGA AGTAATCAAT 3 00 

GACCCAGATG TTAAGCAATT TTTGGAAGCG CATCGAGCTG AATTmACGAA TGCTATGATT 360 

GATGAAGACT TAAATGTGTT ACAAGAGTAT AAAGATCAAC AAAAACATTA TGACGGTCAT 420 

AAATTTGCTG ATTGTCCAAA TTTCGTAAAG GGGCATGTGC CTGAGTTATA TGTTGATAAT 4 80 

AACCGAATTA AAATACGCTA TTTACAATGC CCATGTAAAA TCAAGTACGA CGAAGAACGC 54 0 

TTTGAAGCTG AGCTAATTAC ATCTCATCAT ATGCAACGAG ATACTTTAAA TGCCAAATTG 6 00 

AAAGATATTT ATATGAATCA TCGAGACCGT CTTGATGTAG CTATGGCAGC AGATGATATT 660 

TGTACAGCAA TAACTAATGG GGAACAAGTG AAAGGCCTTT ACCTTTATGG TCCATTTGGG 72 0 

ACAGGTAAAT CTTTTATTCT AGGTGCAATT GCGAATCAGC TCAAATCTAA GAAGGTACGT 78 0 

TCGACAATTA TTTATTTACC GGAATTTATT AGAACATTAA AAGGTGGCTT TAAAGATGGT 84 0 

TCTTTTGAAA AGAAATTACA TCGCGTAAGA GAAGCAAACA TTTTAATGCT TGATGATATT 900 

GGGGCTGAAG AAGTGACTCC ATGGGTGAGA GATGAGGTAA TTGGACCTTT GCTACATTAT 960 

CGAATGGTTC ATGAATT AC C AACATTCTTT AGTTCTAATT TTGACTATAG TGAATTGGAA 1020 

CATCATTTAG CGATGACTCG TGATGGTGAA GAGAAGACTA AAGCAGCACG TATTATTGAA 108 0 

CGTGTCAAAT CTTTGTCAAC AC CAT ACT TT TTATCAGGAG AAAATTTCAG AAACAATTGA 114 0 

ATTTTAAAAT GATTGGTGTA TAATGAATAC AAATCTAAAT CGTTTAAATG ATTGAAGACA 120 0 

AGATGATCTA ATCAATATTA CACAGAAAGC CATTGTTTGA TGAGAATATG GTTAATAAAT 126 0 

TAGATGATTA CTACTTCATT TATGGTATTT GTAATGAATA CCCGGATCAA GACCGTTATC 132 0 
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CTCGTCCCTT GTATAGGGGC GGGATTTTTT GTTTTTTTCA GACATAAATG TTTGTTGGTG 144 0 

TCATAAATTC CCTGTTTATT GTTAATAGGT TTAATGTTAA AACGATGATT GTTGTTCAAT 150 0 

TTTTTAACGA GGTCAGATAA AAGTATTTAT AAAGCAAATA GGAGGGTTTA ACATGGAACA 1560 

AATTAATATT CAATTTCCAG ATGGTAATAA AAAGGCGTTT GATAAAGGTA CTACTACTGA 1620 

AGATATAGCA CAATCAATTA GTCCTGGATT ACGTAAAAAA GCTGTTGCCG GCAAATTTAA 16 8 0 

CGGGCAACTT GTAGATTTAA CTAAACCGCT TGAAACTGAT GGATCAATTG AAATTGTGAC 174 0 

ACCAGGTAGT GAAGAagcGT TAGAGGTATT ACGTCATTCT ACTGCACATT TAATGGCACA 180 0 

CGCGATTAAA AGGTTATATG GTAATGTTAA ATTTGGTGTA GGTCCTGTAA TAGAAGGTGG 186 0 

ATTCTACTAT GACTTCGACA TTGAC CAAAA CATCTCATCT GATGACTTTG AACAAATTGA 1920 

AAAAACAATG AAACAAATCG TTAACGAAAA TATGAAAATC GAACGAAAAG TGGTTTCACG 1980 

AGATGAAGTG AAAGAGTTAT TCAGCAATGA TGAATACAAA TTAGAATTAA TCGACGCGAT 204 0 

TCCTGAAGAT GAAAATGTAA CATTATATAG TCAAGGTGAT TTTACTGATT TATGTCGTGG 2100 

AGTTCACGTT CCATCAACAG CTAAAATTAA AGAGTTTAAA CTATTATCTA CAGCAGGTGC 2160 

ATACTGGCGT GGAGATAGTA ACAACAAAAT GTTACAACGT ATATACGG T A CTGCTTTCTT 2220 

TGATAAAAAA GAATTGAAAG CACATTTACA AATGTTAGAA GAGCGTAAAG AACGTGATCA 22 80 

TCGTAAAATT GGTAAAGAGT TAGAACTATT CACAAATAGC CAATTAGTTG GTGCTGGTTT 234 0 

GCCATTATGG TTACCTAACG GTGCAACAAT TAGACGTGAA ATTGAACGTT ACATTGTTGA 24 00 

TAAAGAAGTT AGCATGGGAT ATGACCACGT TTATACACCA GTACTTGCTA ATGTTGATTT 2460 

ATACAAAACA TCTGGTCACT GGGATCACTA TCAAGAAGAT ATGTTCCCAC CAATGCAGTT 2520 

AGATGAAACT GAATCTATGG TATTACGTCC AATGAACTGT CCACATCATA TGATGATTTA 2580 

TGCQAATAAA CCACATTCAT ATCGTGAATT ACCTATCCGT ATCGCTGAGC TAGGAACGAT 264 0 

GCATAGATAT GAAGCAAGTG GTGCTGTATC AGGATTACAA CGTGTTCGTG GTATGACTTT 2700 

AAATGATTCA CATATCTTTG TTCGACCTGA TCAAATTAAA GAAGAATTCA AACGCGTTGT 2760 

AAACATGATT ATTGATGTGT ATAAAGACTT TGGTTTCGAG GATTATAGCT TTAGATTAAG 2820 

TTATAGAGAC CCTGAAGATA AAGAAAAGTA CTTTGATGAT GATGATATGT GGAATAAAGC 28 80 

TGAAAATATG CTTAAAGAGG CAGCGGATGA GCTTGGCTTA TCGTACGAnG AAgCGATTGG 294 0 

TGAAgCGGCA TTCTATGGTC CGAAACTAGA TGTTCAAGTT AAAACAGCGA TGGGTAAAGA 3000 

AGAGACATTA TCAACAGCAC AAC TTG ATTT CTTATTACCA GAACGTTTTG ATTTAACTTA 3 060 

TATTGGTCAA GATGGTGAAC ATCATCGTCC AGTTGTTATT CATCGTGGTG TTGTATCAAC 3120 
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AGCGCCAAAA CAAGTTCAAA TCATTCCAGT TAACGTTGAT TTACATTATG ATTATGCGCG 3 24 0 

CCAATTACAA GATGAATTGA AATCTCAAGG CGTTCGTGTA AGTATTGATG ACCGTAATGA 3 300 

AAAAATGGGT TATAAAATCA GAGAAGCTCA AATGCAAAAA ATACCTTATC AAATCGTAGT 3 3 60 

TGGGGATAAG GAAGTTGAAA ATAATCAAGT GAATGTGCGT CAATATGGAT CGCAAGACCA 34 2 0 

AGAAACAGTT GAAAAAGATG AATTTATCTG GAATCTAGTT GATGAAATTC GTTTGAAAAA 34 8 0 

ACATAGATAG ACAGTTGTCG CAATAAAATG CTTTAAAACT TTTATTGCGT ATCAAGTTTT 3 54 0 

ACAGGGTTGA TTATGCGTGA TGAATCCTGT ATATTACAAG TTAGTTAAAA TATTAAATTG 3 6 00 

AGTTAGAGGT TGCATGTTTA ATTAGTAACT TGT CAGAAGT ATTTATGGTA CATAAGTTGA 36 60 

ACAAGTGAAA GGTAAAGATG CCGAAATAGA TATAAACCAT AAATTATATC TATTGGGACA 372 0 

GTTTTCGAAT AGGAACTGTA CTGTCACAGA ATGTGATGTG CTAC CTTATA TAGATAATTG 3 78 0 

CCAAAGTGGT TGCATATCTT AAAGGTATGT AGCCACTTTT TTACTTTTAA TATCACTATG 3 84 0 

TTCTGTAAAA AAGGGTATGA AAGTGAATAA AGGTTATTTA TTTCTTGGCC TCTAAAACAT 3 900 

GGAAAGGGAG CTTATATGTC AAAAGTTCAA AATGAAAGTA ACAATGTTGT CAAAAGGGGA 3 96 0 

CTTAAAGATC GTCATATTTC TATGATTGCG ATTGGGGGTT GTATTGGTAC AGGTTTATTT 4 02 0 

GTAACTTCTG GTGGAGCAAT TCATGATGCA GGTGCTTTGG GTGCATTAAT AGGATACGCA 40 8 0 

ATTATCGGAA TAATGGTATT TTTCTTAATG ACGTCACTTG GCGAAATGGC TACGTATTTG 414 0 

CCAGTATCAG GTTCATTTAG TACATATGCT ACAAGATTTG TTGATCCATC TTTAGGGTTT 4 20 0 

GCGCTTGGTT GGAACTATTG GTTTAACTGG GTAGTGACTG TAGCAGCAGA TATTACGATT 426 0 

GCAGCACAAG TCATTCAATA TTGGACACCA TTGCAAGGCA TACCCGCTTG GGCATGGAGT 4320 

GCGTTGTTCT TAGTTATAAT TTTTAGTCTG AATTCGTTAT CAGTTCGCGT CTATGGTGAA 438 0 

AGTGAATACT GGTTGGCATT GATAAAAGTG GTTACAGTTA TTGTTTTCAT TGCAATTGGT 444 0 

TTATTAACGA TTGTCGGAAT CATGGGTGGT CATGTTGTAG GATTCGAAAT ATTTAATAAA 4 50 0 

GGTGAAGGTC CAATTCTTGG TGGCAACTTA GGAGGAAGTT TGTTATCAAT TCTAGGTGTA 4 56 0 

TTCTTAATCG CTGGTTTCTC ATTCCAAGGT ACTGAGTTAA TTGGTATTAC GGCTGGTGAA 4 62 0 

TCAGAAAATC CTGAACGTGC TGTGC CG AAA GCAATTAAAC AAGTATTCTG GAGAATTTTA 46 80 

TTATTTTACA TTTTAGCCAT TTTTGTTATC GGTATGTTAA TTCCTTATGA TAGTAGTGCA 4 74 0 

TTAATGGGGG GTAGTGATAA TGTAGCAACG TCTCCATTCA CATTAGTGTT TAAAAATGCT 4 800 

GGATTTGCGT TTGCAGCATC ATTTATGAAT GCAGTCATTT TAACGTCTGT GTTA 48 54 
(2) INFORMATION FOR SEQ ID NO: 107: 
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(A) LENGTH; 2488 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 107: 

,0 ATCAAAAATT GATTGTTTTC nATTTTTTGT TTCAGCGCGG GATCTTTTAC GTCTTTTGTG 60 

AAAACGaTTT TATTATTAAC TACTTTTACT GGATAACTTT TGTATGTCGA GTCAGTAGCA 120 

TTTTTTCTAT CGTTTGTAGT TGTGTCATAT TCACCAgTTA TTTTATGTGT GTTCTTATCT 180 

15 ACCTTTAACA ACATACGGTC TTCTTTTAAA AGCTCATCTG ATCCAACAAC TGAATAAGAG 24 0 

GATTCTATAT ACCATGTGTC TTGATCATTA TTTTCATAAT GGGGATTATC GTGACCATCA 300 

ATTTCATAAA GCGTTT CTAA GTTTTTAATA GGATACGTAC TTAGTACTTT TTTAAGACCA 36 0 

20 

TCTTTCAAAT GAATTTG TTC CCACTTCATT GCCAAAAACA TATCGCCACT GACTA CAATT 4 20 

GAAATAATAA TAATTGCTGC TAAG TTTAAC CAGAAAATTT TATGTGCTTT CATACATTCC 4 80 

CACCGTTTCT CAAAATACTT CATTAACACT ATAATAATAT ATTTTGAAAA ATATTTACAT 54 0 

25 

CAGTATTAAA GTGAATATCA AATTTTAAAT TTATGAAAAT AATAGATATT TATAAAAAGC 6 00 

GGAAAAGAGA TACAATAAAA AACTGCATGA CG TTTGAGAC GTCACACAGT GTAACTAAAA 660 

ATTTAAAAAG TTGTTGCTAA TTTTTCAGCA TTATTAATAC TAGTTGCTTT AATTTCTTCA 720 

30 

GTCTTATGAG GTTCAGCATT GTGTCCTTCA ATAATGATTG TTTCATATGA TGGCACACCT 78 0 

AAGAATGTCA TAATTGTTCT TAAATAACGG TCACCCATTT CAAAATCAGC AGCAGGTCCT B4 0 

35 TCAGTATAAT ATCCACCACG TGATTGAATG TGTAATACTT TTTTGTCAGT TAGTAAAC CT 900 

TGTGGTCCTT CAGCAGAATA TTTAAAAGTT TTACCTGCAA TTGAAATAGC ATCAATATAT 960 

GCTTTAACTA CAGGTGGGAA AGAAAGGTTC CACATAGGCG TTACAAATAC ATATTTATCT 102 0 

40 GCACTTAAAA ATTCTTCTAA AATGTCACTC AATCTTGAAA CTTTCATTTG TT CAT CAT CA 10 8 0 

GTTAACGTTT CGCCATTACT CATTTTTCCC CAAC CAGTTA ATACATCTTT GTCAATAACT 114 0 

GGAATATAAG TTTCArATAA ATCAATATGT TTCACTTCAT CATCAGGATG TTGTTGTTGA 12 0 0 

45 TATGTTTCGA TAAATGCTTT ACCAGCCGCC ATAGAATTTG ATACCAGTTC ATTAAAAGGG 12 60 

TGTGCTGTAA TATATAATAC TTTTGCCATT TGAAAATTCT CCTCTGkTTC TGTTATTTTC 132 0 

TTAAGTATAA TTATTATACT CGATATAAAA TTTAATATCA ATCAAAATAT TCAAATTACC 13 8 0 

50 

ATCATTTTCT TCATCTATAT nTGGCAGTAC TACTAAAGTA TGAGTGCATT TAATTATGAa 144 0 

ATAGTTGATT TaGAATAtAT ACTTAATACC CAAAATATAT GAAGGATGGA TGCCACTATG 150 0 

55 
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ATTATTTATA TAGATGACAT TCAAAAATGG TTTAACCAAT ATACCGATAA ATTGACACAA 162 0 

AATCATAAAG GACAAGGACA CTCAAAATGG GAAGACTTTT TTAGAGGGAG TCGGATTACT 16 80 

GAGACTTTTG GTAAATATCA ACATTCACCA TTTGATGGTA AGCATTATGG CATTGATTTT 174 0 

GCATTGCCAA AAGGTACACC AATTAAAGCG CCGACGAATG GTAAAGTAAC ACGTATCTTT 180 0 

AATAATGAAT TGGGCGGCAA GGTATTACAG ATTGCCGAAG ACAATGGAGA ATATCACCAG 1860 

TGGTATCTAC ACTTAGACAA ATATAATGTC AAAGTAGGTG ATCGAGTCAA AGCAGGTGAT 1920 

ATTATTG CAT ATTCAGGCAA TACAGGTATA CAAACGACAG GCGCACATTT ACATTTTCAA 198 0 

AGAATGAAGG GTGGCGTAGG TAATG CAT AT GCAGAAGATC CAAAACCGTT TATCGATCAG 2 04 0 

TTACCTGATG GGGAACGTAG CCTATATGAT TTGTAGTTAT AGAAGGGTGC CCGCAGTCTA 2100 

AAAAATTAAG CAATCATTGT GTGAGTATGA TACTTACATA ATGGTTGCTT TTTTCAATGA 2160 

AAATCGTAAT GCTAAGTCAT ACTTGTTTGA TTTAGATATT ACTTAAAATG TAAGACAAGG 222 0 

TTGTTAGCAT TGGCAGTGAA ATATCGCACA TAAAAAACAT TATTGTCACA CTAGAAAATA 22 8 0 

GTTGTGCACT ATATCAATTT T CTGTAT AAA AGTTTAATTC TGACAGTAAT GTAAACGTTT 234 0 

ACAATTTATG ATTGACATTA ATAATGACTG AATATATGAT TTATGTAAGT ATTTGTG CAA 24 0 0 

CGTTTTCACA AAGTGTATTG CACaAyCAAA CTGtAAACaA aGTATGGGGg GC CATAACAT 24 6 0 

GGCAGAACTA AGTTAGAGCn TATTAAAA 24 8 8 
(2) INFORMATION FOR SEQ ID NO: 108: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 4093 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 108: 

TTTTCTTTAT TTCAAmCTGT ATATTaATGA TGTCACTTCA TTTGATACGA TTCTTGATAA 60 

CCTATTCAAA ATTCCGCCAA AT AA CAT AAA TATTATATAA ATGCCGATAC TTTTAATCAT 120 

TTTCTACTTT TTCTTCGATA CGGAAACTTG TTTTCGAATT GAACACTTCA CCAGCTTTTA 180 

AAATTGACGG TGCTTTTTCA CCATATAAAT TAATATCATT TGGTAAAAAT TGTGTTTCTA 24 0 

ATGTAAAGCC AGAATGTGGT TTATAAATAT TAAATGGACT ATCCCACTCA TCAGGCTGGT 3 00 

TAAAAGTAAA GAACACAACA TGAGGCATAT CTGTATCGAC CTCTAACATA AATT CATGAT 360 

TTT CAACATA CATTTTATGT TCACCAACTG TAAATGGGTG ATCGAGACCA CCAAAACGTG 4 20 
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TATC TTCAAA CACTTCATGT AAATCTAGAA TATCACCTGT AACAATATTT CGCTCATCTA 54 0 

ATACATACAT ATCTAATTGA TTACTTGAAA TGCGATGATT ATCAACGACA TTATTATCTC 60 0 

GATTCAAATT GAAGTACACA TG ATT CG TAG GACTAAACAA TGTGTCTTCT GATGCAACTG 660 

CTTCGTATTC AATCGACCAT TGGTGAT CCG CATCATAAAT ATGTGTAATC GTCACATCGA 72 0 

TATCACCCGG GAAATGATCA TCAGCTGATT TCAACACCGT CTTAAATATA ACTTTAATTT 78 0 

GAGCAATTTC ATTTCTAATT T CAT AATCAA ATAACTTATT GTCCAAACCA TGACATCCAC 84 0 

CATGTAAATG ATGTTCACCG TTGTTTTTTT CTAACTGATA TTCTTTACCT TTCAACTTAA 900 

ATTTAGCATT ATCAATTCTA CCGCTATATC TTCCTATAGA AGCACCAAAT TTAAAAGGAT 96 0 

TACTATGATa AAATTCATCC GCTTCAACAA CATTTCCAAG AACAATATTA TTATCATGAT 102 0 

ATTTCCAAGA CACTACTCTT GCTCCATAAT TCGTAAAAAT AATTTTAGTT TCATCATTAT 108 0 

CAATTTTGAT TAAATCTACA CCTTGTCTTT GGTGCTCAAC TTCAACTATC ATTTTTACTT 114 0 

CTCCCTTCTA AC CACAAGTG TTCAAGCTCT GCTGGGTAGC AACATTACTA AAACACCTAC 1200 

AATACAAATG ATTGCACCGA TAA CAT CAT A TTTATCTGGC ATTTGTTTAT CTACGACCAT 1260 

CGCAAAAATC AAACTCATGA TGATAAATAC GCCACCATAT GCTGCATATA CTCTTCCGAA 1320 

TGATGGAAAT GATTGAAATG TCGCAATGAC ACCATATAAC ATGAGT AT CG CACCGCCTAT 13 80 

TAGC CCAACA AGTGAAGACT GTCCTTCCCT AAGCCACAGC CAAATCAGGT ATCCCCCACC 144 0 

TATTTCACAT AAGCCAGCTA ATATAAATAT AAAAATCGGA TATAACATGA AATCACTCCA 150 0 

TCACACATTT GCTATCAATA ATCTATCGGC TACATATCAT TTGTTTACAT TTCTTCTTAC 1560 

TTCACATTCC CATTTTAAAA AGTTCGTTTT CACATTCATA TTGTACACTT TTTTAGACAT 1520 

TATTCTATAG CTAAATATAA AAAAATAAGA GTAACACGCT TTCATCATCA TTTTATATGA 16 8 0 

TAAATGTGTG TCACTCTCAT CAATTTTATT TTTTAAATAC ACGTTTCATT GAATTAAATA 1740 

AGCCACGTTC AAATGTAAGT ACTGAATCTT TATATGTTTT AATTGCAATC CATATCAAGA 1800 

CAGCTACCAT TACAATTGAG ATTAAAGAAC TTAAGATGAC CTCATATATT TGAAGCCCTG 1860 

AAGTTTGAGC GCGTACAACT AATTGAAATG GCGCTAAAAA CGGAATATAA CTTGTGATTA 1920 

AAGCAAGTTG TCCATCAGGA TTATTTATCG TGAATATCGC GATATAAAAT GCAATCATAC 1980 

CAAGTAATGT CAGTGGCATC AAAGATTGAT TTAAATCTTC TATTCTAGAT GTTAATGATC 204 0 

CGAGGATGGC TGCAAGTAAT ACATACGC CG TAATTCCAAC AATACTACTT ATAATTCCGA 2100 

CAATAATAAT TTGCCAAGAC AATTGATTCA TTTCCACGTT AAAACCTTGT AG CAAGTCTT 2160 

TTAAGTCAAA GGCAAAAATG CATATAACTG CCATCAATAC AATTAAAATA ATCTGAGTCA 2220 



625 



EP 0 786 519 A2 

TAATAATCAT TTCAATGACA CGCGATGTTT TCTCACTAGC AATTTCCATA GCTATTTGAG 2 34 0 

ATGCATAATT TAAAACAATG AAGAACATTA GAAAGATAAT GCCATmaGcT AAAGCATAGT 24 0 0 

TGAAAATCTT TTGTCCTTCT GATACTTTAT CGACTTCATC ATTAGAAATC ACCTTATTAT 24 6 0 

CAACTTTACT TTGTGCTTGT AATTTTTGTA AGTCTTCTTT GTTGATATTT AATTCCCCGG 252 0 

CTAC CATATT TGTTTGAATA GCTGTAAGCA GTGCTTGTAC TTTTTGTGAA TCTT CATG AC 258 0 

TTACTCGCTT CTCACTAATG ATTGTCCCTT GTAACGTGCG ATTTTGATTC ACCTTGATAA 264 0 

TATAAGCTTT ATCAAGTTTA TGTTTTTTTA CTTCTTTTTC AGCATCTTCT ATAGAAACTT 2 700 

TAGTAAACTT AGCAT CACTA TGAAATGTAT TCGCCTGTTG CTTGAAAACC TTATAGATTT 2 76 0 

GTTCATTCGG TGCTGCTACA CCAATTTTAT CTGGACCATC ATCAAACATG TTAATAA TCT 2 8 20 

TATCAATGTT AGATAGGCCA ATCATTAAGG CAGCAATAAT AATCATAAAA ATTACAAATG 2880 

ATTTAGCTTT AATTTTTTTG ATATATGTCA AAGTAAATGT CGCCCAAAAC TTATG CATC C 294 0 

TTGCCACCAA CCTTCTCAAT GAATATATCT TGTAATGATG GTTCTACAAC TTGGAATCGT 3 000 

TTAACATAAC CTTGATGTGC CACAACTTGA TAAATATCTT TGGCTACGTC TTCATTCTCA 3060 

ATCGTCAACT GAAGACCTTG CTTCATGTTT TCACTATGAA TGATGCCTCT AATGTTTGTT 312 0 

AAATCTGGTA GTGTTGTTTC TGATTCAATG ACAAC TTTCT TGTTACCATT AGATGCACGT 318 0 

ACATGATTGA TATCACCAGA AACAACAAGT TGACCTTTAT CTAAAATACA AACATCATCA 324 0 

CATAATTCTT CAACATGCTC CATACGGTGA GAACTATAAA CGATTGTACT GCCCCAATCA 33 00 

TTTAAGTCTT TAACTGCTTc TTTTAATAAC TCAACATTAA CTGGGTCTAG ACCACTGAAA 3 360 

GGCTCATCTA ATATTAGTAA TTCTGGTTTA TGTAACATAC TTGCTAACAG CTGAATTTTT 3420 

TGTTGATTCC CTTTTGATAG ACTATCAATT CGTTTTTTGC GGTTTTCAGT AATATCAAAA 3 4 80 

CGCTCAAGCC AATACGATAT TTGCTGTTGT ATTTCTGTTT TTGACATTCC CTTTAAAGTT 3 54 0 

GCCAAATATT TCAATTCTTC TTCAACTGTC AATTTCCCAT GTAAACCGCG TTCTTCCGGT 3 600 

AAATAACCAA TAC GATTGTA CATTGTTTTA TCTAGTTTTT TACCGTTATA CGTrrTGTGT 36 60 

CCTTCAGTTG GTTCACTTAA GCCTAAAATC ATACGAAATG TCGTTGTTTT ACmTGCACCA 3 720 

TTTCTTCCTA GAAAACCTAA CATTTTACCT GATTCTAACT TTAATGAAAT ATCATTTACT 3 7 80 

GCCGTCATCT TGC CAAAACG TTTCGTAACA TGTTCAATTA CAAGTCCCAT ACTTTGCCTC 3 84 0 

CTAAAAAnAT ATGTATTTAT CTTAATATAA CATTTCCATT CTCTATAAAT GCAATATTTT 3 9 00 

TAAAATGAAT TTATTTTTAA AATTTCTGAA ATTGAAAAAT TTAAATAGTG CCATTTTTGC 3 96 0 

ATGTTAAGTA TCATTAGCAC TAGATATGTT TTTTCCATGC CTTTATTGCC TTATTTGTAA 4 020 
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CTTnCCGGTG TTT 

(2) INFORMATION FOR SEQ ID NO: 109: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 17846 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 109: 

TGCCAAACTA CCTTTTGACA GTCGTTGCTG TACTTCAGGA TGATCAATCA CATATnTTAC 60 

TTTATCAAAT AGGGCATCTT CAT CATTTTT AGTAATTAAA TAACCATTGA AATCTGAAGT 12 0 

AATCAGTTCG TTAGGTCCAT ATTTAATATC ATAACTAATA ACTGGAACAC CATGTGCTAA 180 

AGATTCAAGT AGCGCTAAAG AGAAACCTTC CATGTTACTT GTTATTAAAC TCAAATAGGC 240 

ATCGCTATAT TCTTGGTCTA GATTGCTTAA AAAGCCGCGT AAGTAAACAT GATTTTCCAA 3 00 

TCCATATTTT TGTATCAATT CATTTAATTT TTTACTTTCA GAa CCAAAAC CATACATATG 360 

AaGCTCTATT TTTGGGACAT ACGATACTAA GCGTTTAATT AATTCAATTT GTTGATGTAA 4 20 

TTGTTTTTCA GGTGAATAAC GAGCAACGGA AATTAATTTA ACACTGCGCT GATCTAATGT 480 

TTGGACTGGT GTATCAATTG TTTCACTATA GCCGACAGGA ATATTAACAA CTGGAATAGT 54 0 

ATGGTTAATA CGTTTTTCAA CATCTAATTT TTGCTGCTCA GTAGAAACGA TAATTGCACG 6 00 

ATATCGAGAT AAATTTTCAA ACATCGCTTT ATATACATTT TTAAATGGCG ATGAATCTAA 660 

TGCATCAATA TTTTTAATGT GTGTACTGTG AAGCACAGCT ACTACTGGGA TTGACTCAGG 72 0 

CGTTAAGTTG AAAATAGGTG CTGTGTACAC ATT AC GAT CA CTGAAAAATA AATCCCCATG 7 80 

TTGATATAGT TGTTTAATGA AAAATG CGCC TAATTCCGTT T CATTATTAA AGAAATATTG 84 0 

TTTGTTAGCA TAGTAAACAA TAATTTTTTG TACTTCTGGT TTGCCATCCT TGTAAGAAAA 900 

ATACTTTTCT AATTTTGTGT CACCTTCTGG ATTATAGAAA AATTCACATA ATGTTTGTTG 96 0 

TTTATCAACA AGAATCCTAC TACAACTTAA AAAGCCACGC ACATCATAAA AATCACGTTT 102 0 

TACTTtTCGT CTTTGACTAT CAAAATGATT TACATAATCT AATATACGAT ATTTAGGATC 108 0 

TTGAAAATGG GCATACATTA AGAAACGCTC TTGAT CAT AT ATTCTAAAGT CATGACTATT 114 0 

TTCAACATGT TTTAAAGTAT AATGACATTC AT CAGTC GAA TACG ACAAC C AGTCAAATGG 12 0 0 

TTCATTGCGT TCTAAATATG TTGCTTCTTG GAAGAAATCA TACATATTAA TATAGTCAGA 1260 

ACTAGTAATA TAATTTTGGG CATTTCTATA TAAATATCTA TTCCATGACA GAAATACACA 132 0 
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CCCAGTTAAA TTAACACCTA AACTATTACC TACAAAATAA TTCATTTACA ACACCACTTA 1440 
TATCTATTTT TTATAATTAT AT CACATAAT ATTTAATTAC TTCTTTTAAC TGGAAGATGT 1500 
GTTTATTTAT AAAACAACAA ATTTTGATAT TTATAATGAT AGTAGTTATT CAATCAcTAC 156 0 

GACCcAATAT ATCATkGTAG AGCTTAGGAT ATTGATTTAT GACTCAGGCA CATCAAATGa 1620 
GAgGATTTAT AAArGAGATA TACAACTCTA GAAGGTATAA TAAAAACGCG CAACTAATGT 16 SO 

TACGCGTTTG AATTAATCAT ATGATATTAT TTGCGATACT TTAATTTAGC GAAAgcATCA 174 0 

TGTTGATGGA TAGACTCTTC ATTACGACAT TCGATATCGA AACCGTCTAA CCAATCAAAT 1800 
TCAACTAAGT CCGCGGCAAT TAAACGAATT AAGTCTTCGA CAAAACGTGG ATTTTCATAT 1860 
GCACGCTCTG TCACACGTTT TTCAT CAGGA CGTTTTAAAA TAGGGTATAG AATTGAACTT 192 0 

GCATTAGCTT CCATTGCATC TAAAATTTTA TTTTTATAGT CATCAACTAT GTCTTGATCT 19 80 

TTATTAATAT ATGTTTTAAC AGTGACAACA CCACGTTGGT TGTGCGCTGA ATACTCACTT 204 0 

ATTTCTTTTG AACAAGGGCA TAGCGTTGTG ACAGTTGCTT CAATAGTAAG TTCTTTACGT 2100 

GTAnCTTTAT CACCGTCAAT TGCTAATCCA TAAGTGACAT CGG CATTACC AACTG CTTTA 216 0 

ATATTTGTGG TTGGACTATA GCGATCAAAG AACCATTTCC CAGAAACATC AACGCCTGCC 222 0 

GCATTTTGTT TCATATTCGT TTGTAAAGTG CGTAACACCT GATAAAGTGT ATTAAATTCA 228 0 

AGTTCAATAC CATTATCATA GTGCTTTTCA ACACTTTCGA TTATACGGCT CATATTAATA 234 0 

CCTTTTTCGT CTTTTGTTAA ACTTGTTGAA AAACTAAATG TGCCAGCTGT TTGATACTGG 24 00 

TCAACAAGTA CAGGGTACAC TAAGTTTTTA ATACCAACTT CTTCTATTTC AAATAAAAAA 24 6 0 

TCTTTATGTG TACTTTGTAA ATCTGTCATT TCGTTCTTAG TAGTAGGTTT CGTGCCTTCA 252 0 

ATAGGATCTA CGGAACCAAA GTGTTTCCAA CGACCTTCTC GTGTCGATAA ATCAAATTCA 258 0 

GTCATTTTTT TCCTCCGTTA AGATTTAAAG TGATATGTCC AATATGGTTC GACTGTTAAA 2 64 0 

AAGCTGTGTT GTTTACCATC GATTT CAGGA CTTGCTAATT GTTTTAAAAA TGGACCTGTT 270 0 

TGAGAAG CAT GTGCTTCAAA TGCCTTAATT TTAAGTTCTT TAAAATCTGT AATATCATTT 2760 

TGAATATCAG GTTCTCCAAG AG CTTCGGTT GCATCATTAC TGAACGCAAC TAAAGTTAAA 2 820 

CGAGGGCGTT CTTCTTTAGG CATGCGTTCA ACCGTTCGAA TTACAG CGTC TGCTGTTGCT 2 88 0 

TCGTGATCAG GATGTACTGC ATATCCAGGA TAAAATGAAA TAATCAATGA TGGATTTGTA 2 94 0 

TCATCGATTA AAGATTTAAT CATACCATCT ATATG TTCAT AGGGTTCAAA TTCGACAGTT 3 00 0 

TTGTCACGTA AACCCATTTT TCTTAAATCA GTAATACCGA T AA CTTTA CA AGCTTCTTCT 3 060 

AGTTCACGCT CACGAATACT TGGTAATGAT TCGCGTGTTG CAAATGGGGG ATT A C CT AAA 3120 
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TAATTTGCTA 


ATGTGCCTGC 


AGATGAGAAG 


GTTTCATCAT 


CAGGATGTGG 


AAATATTACT 


3240 


AATACATGTC 


TTTCGTCAGT 


CATGTTGATG 


CCTCCTCTAT 


AAATTAAATG 


GTCGCTCACT 


3300 


AATTTGAAGT 


GCTG CAGCGA 


GTTGACCTTC 


GTAATTAAAA 


CCTGCAATTA 


AAAATTCATC 


3360 


ATGCTCATTG 


ACCTCAAAAT 


GCGTTAGACC 


TTGTACATAA 


ACCCAACCAC 


CATTTGATAG 


3420 


TTTAAGACCA 


ATGCGATAAG 


GTTCTTTATT 


ACCACCTTTT 


AGTTGTGCAT 


GCGTATATGT 


3480 


TATTTGTATG 


TTTCTTAAAA 


AAGTACCAGC 


ATTAAAAACA 


CGTTGATCGA 


AATGGTTCGC 


3540 


ATAGGCCCCA 


TTTGTCGTTT 


CAACATGCAG 


ATACACAGGT 


TTATGTTCAA 


AAGAAGCAAG 


3600 


TAAATCTATA 


ACTTCTTGTT 


CTTTAATTGG 


TTCCAACACG 


TT CACTCCTT 


ACACTATCAA 


3660 


TGTGTTTATC 


TTTCTATTTT 


ACTAAAAACT 


ATTCGATAAT 


TGTATACGAT 


TGCTCAATTA 


3720 


TTTATAAATT 


AATTTTCATG AAGGGTAATT 


ACTCAGGATT 


ACGTAATCAT 


ACAGCATTAG 


3780 


TTTTTTACTT 


TTAAAAATCA 


AAAATTTGTT 


GGAATTTGAA 


AAGTGTTAAA 


CATTAAAAAT 


3840 


GATGCTATAT 


TAATGGTGTA 


TGAATGAATT 


CATAAGTTTT 


TAAAATGTAT 


TAAATTTGTG 


3900 


GAGGCATGTA 


AACAATGAAA 


GTATTAAACT 


TAGGATCGAA 


AAAACAAGCA 


TCATTCTATG 


3960 


TTGCATGTGA 


GTTATATAAA 


GAG ATGG CAT 


TTAATCAGCA 


CTGTAAACTA 


GGTTTAGCAA 


4020 


CTGGTGGTAC 


AATGACAGAT 


TTGTATGAAC 


AACTTGTTAA 


GTTGTTAAAT 


AAAAATCAGT 


4080 


TAAACGTAGA 


CAATGTATCC 


A CGTTT AATT 


TAGACGAATA 


TGTAGGTTTA 


ACCGCATCAC 


4140 


ATCCGCAAAG 


TTATCACTAT 


TATATGGATG 


ACATGCTTTT 


CAAACAATAT 


CCTTATTTTA 


4200 


ATAGAAAGAA 


CATTCATATT 


CCAAATGGAG 


ATG CCGATG A 


TATGAATGCG 


GAAGCGTgCA 


4260 


AAATATAATG 


ACGTTTTAGA 


ACAACAAGGT 


CAACGTGATA 


TTCAAATTTT 


AGGTATTGGT 


4320 


GAAAATGGTC 


ATATTGGATT 


TAATGAACCT 


GGTACGCCGT 


TTGATAGCGT 


TACT CATAT C 


4380 


GTTGATTTGA 


CT GAAaGTAC 


TATTAAGGCT 


AATAGTCGAT 


ATTTTAAAAA 


CGAaGATGAT 


4440 


GTTCCAAAGC 


AAGCCATTTC 


GATGGGACTT 


GCTAATATTC 


TTCAAGCCAA 


ACGTAT CATT 


4500 


TTACTCG CAT 


TTGGTGAAAA 


GAAACGTGCT 


GCTATTACAC 


ATTTATTAAA 


TCAGGAAATT 


4560 


TCTGTTGATG 


TTCCAGCCAC 


ATTACTTCAC 


AAACACCCGA 


ATGTTGAGAT 


ATATTTAGAC 


4620 


GACGAAGCTT 


GCCCGAAAAA 


TGTTGCGAAA 


ATTCATGTCG 


ATGAAATGGA 


TTGATTGCAA 


4680 


TGTTTAATTA 


AGAAATGCCT 


CGGGAAAGGT 


TCCAATAGAA 


AGATAAAAAG 


CATTGGAAGG 


4740 


ATGATTTTTA 


GTGGAATTAC 


AATTAGCAAT 


TGATTTATTA 


AACAAAGAAG 


ACGCGGCTGA 


4800 


GTTAGCAAAT AAAGTAAAAG 


ATTATGTAGA 


TATCGTAGAA 


ATCGGTACGC 


CAATCATTTA 


4860 


CAACGaAGGT 


TTACCAGCAG 


TTAAACATAT 


GGCAGACAAC 


ATTAGTAATG 


TAAAAGTATT 


4920 
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CGCGGATGTA ATTACAATAC TAGGTGTTGC AG AAGATG CA TCAATTAAAG CAGCTATTGA 504 0 

AGAAGCTCAT AAAAATAATA AACAATTACT AG TTG ATATG ATTGCTGTTC AAGATTTAGA 5100 

AAAACGTGCA AAAGAACTAG ATGAAATGGG TGCTGATTAT ATTG CAGTAC ACACTGGTTA 516 0 

TGATTTACAA GCAGAAGGGC AATCACCATT AGAAAGTTTA AGAAC CGTTA AATCTGTTAT 5220 

TAAAAATTCT AAAGTTG CAG TAGCAGGTGG AATTAAACCA GATACAATTA AAGATATTGT 5 2 80 

CGCTGAAAGT CCTGATCTTG TTATTGTTGG TGGCGGAATC GCAAATGCAG ATGATCCAGT 534 0 

AGAAGCTGCG AAACAATGTC GCGCTGCAAT CGAAGGTAAG TAATATGGCT AAATTTAGTG 54 00 

ACTATCAATT AATTCTAGAT GAATTAAAGA TGACTTTGTC A CATGTTGAA GCGGATGAGT 54 6 0 

TTTCAACTTT TGCATCCAAA ATACTACATG CTGAACATAT ATTTGTAGCT GGCAAAGGAC 55 2 0 

GTTCAGGATT CGTGGCGAAT AGTTTTGCAA TGCGCTTAAA TCAGCTCGGC AAACAGGCAC 558 0 

ATGTTGTTGG AGAATCAACG ACACCTGCGA TTAAGTC GAA TGATGTATTT GTAATTATCT 564 0 

CTGGTTCAGG TTCCACGGAA CATTTAAGAT TATTAGCAGA CAAAGCAAAA TCAGTAGGTG 5700 

CTGACATCGT ATTAATTACT ACAAATAAAG ATTCTGCAAT AGGCAATCTA GCTGGGACGA 5760 

ACATCGTTTT GCCTGCAGGT ACAAAATATG ATGAACAAGG CTCGG CACAA CCATTAGGAA 5820 

GTTTGTTTGA ACAAGCATCT CAATTATTTT TAGATAGTGT TGTAATGGGA TTGATGACTG 58 80 

AAATGAATGT TACGGAACAA ACGATGCAAC AAAATCATGC TAATTTAGAA TAAAATAAAG 5940 

ATAGTCGATA ATATGATGCC TAGGCAGAAA TATTATCGAT TATTTTTTTA TTTAAATAAT 6 0 00 

AAATTATAGT ATAATATCAA TAATAAACGA ATAGGGGTGT TAATATTGAA GTTTGACAAT 6 06 0 

TATATTTTTG ATTTTGATGG TACGTTGGCA GACACGAAAA AATGTGGTGA AGTAGCAACA 6120 

CAAAGTGCAT TTAAAGCATG TGGCTTAACG G AAC CAT CAT CTAAAGAAAT AACGCATTAT 6180 

ATGGSAATAC CTATTGAAGA ATCATTTTTA AAATTAG CAG ACCGACCATT AGATGAAGCA 6240 

GCATTAGCAA AGTTAATCGA TACATTTAGA CATACATATC AATCTATTGA AAAGGACTAT 6300 

ATTTATGAAT TTGCGGGTAT AACTGAAGCC ATTACAAGTT TGTATAACCA AGGGAAAAAA 636 0 

CTTTTCGTGG TGTCTAGTAA GAAGAGTGAT GTATTAGAAA GAAATTTATC GGCTATTGGA 64 20 

TTAAATCACT TGATTACCGA AGCTGTTGGA TCCGATCAAG TAAGTGCATA TAAACCAAAT 64 8 0 

CCTGAAGGCA TACACACAAT TGTGCAACGC TACAATTTAA ATAGCCAACA AACGGTGTAT 6 54 0 

ATTGGTGATT CAACGTTTGA TGTTGAGATG GCACAACGTG CTGGTATGCA ATCTGCAGCT 6600 

GTCACTTGGG GTGCACATGA TGCAAGGTCA TTACTTCATT CAAATCCGGA TTTTATTATT 66 60 

AATGATCCAT CAGAAATTAA TACCGTATTA TAAAACTTGT TAAAACAGAG AATAC CATGG 6 720 
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ATTTAAAATA AATATTTATT AAA CATT ATG AATTTTTAAA GAGTAATGTC TGACTCGTTG 
ATAATTTATT TTTGTAAAAA TAAATTAAAG TAATGACAAA GTTATTGAAG TAAATTGAGT 
ATAAACATTT AAATACGATG TCGAAAATGG CGATAG CAT A T CACTTAC AT GAAGTTGTGT 
GctATCGCTA TTTTTAGTTA TAATTCCAAA AAGTTAATCG TTCGATGATT TAAGAATTAT 
TATTGTTTAA TTCAAATGTA TGAGGGTATA AAATCATTGA ATTTAATTCG ATAAAGCGAA 
ATTTTTGAAC AAA CAT A CTT TTGTATTTAT ATAAAAGTTT AAATTCTTAT AAATTTGACA 
AAACTAATTA ACTC CGTATA ATTATGAAAC ATACAAGAGG GAGTGTATGA ATTCATGGAT 
TTTAATAAAG AGAATATTAA CATGGTGGAT GCAAAGAAAG CTAAAAAAAC CGTTGTTGCA 
ACCGGTATCG GTAATGCAAT GGAATGGTTC GATTTTGGTG TCTATGCATA TAcAACTGCG 
TACATTGGAG CGAACTTCTT CTCTCCAGTA GAGAATGCAG ACATTCGACA AATGTTGACT 
TTCGCAGCAT TAGCCATTGC GTTTTTATTA AGACCAATTG GTGGTGTCGT ATTTGGTATT 
ATTGGTGACA AATATGGACG TAAAGTTGTA TTAACATCTA CAATTATTTT AATGGCATTT 
TCAACATTAA CCATTGGATT ATTGCCAAGC TATGATCAAA TTGGACTTTG GGCAC CAATA 
CTATTATTGC TTGCAAGAGT ACTACAAGGG TTTTCAACAG GTGGAGAGTA TGCGGGGGCA 
ATGACATATG TTG CCGAATC ATCTCCAGAT AAGCGTCGTA ACTCATTAGG TAGTGGACTA 
GAAATTGGGA CATTATCAGG TTACATAGCT GCTTCAATTA TGATTGCTGT ATTAACATTC 
TTTTTAACAG ATGAACAAAT GGCATCATTT GGTTGGAGAA TCCCATTCTT ACTCGGTTTA 
TTCCTAGGAT TATTCGGCTT ATATTTACGT CGTAAGCTGG AAGAATCACC AGTTTTCGAA 
AATGATGTTG CAACACAACC AGAAAGAGAT AACATTAACT TTTTACAAAT CATCAGATTT 
TATTACAAAG ATATATTTGT ATGTTTTGTA GCTGTTGTAT TCTTCaATGT TACAAACTAT 
ATGGTAACTG CATATTTACC AACCTATTTA GAACAAGTTA TTAAATTAGA TGCAACGACA 
ACAAGTGTAT TAATTACTTG TGTCATGGCA ATAATGATTC CATTAGCATT AATGTTTGGT 
AAGTTAGCGG ATAAAATAGG TGAAAAGAAA GTATTTCTAA TTGGTACTGG TGGGCTAACA 
TTATTCAGTA TCATCGCATT TATGTTATTA CATT CACAAT CATTTGTTGT AATAGTAATC 
GGTATATTTA TATTAGGATT TTTCTTATCA ACTTACGAAG CGACAATGCC AGGGTCGTTA 
CCAACGATGT TTTACAGTCA TATAAGATAT CGAACTTTAT CAGTAACATT TAATATCTCT 
GTTTCGATAT TTGGTGGTaC GaCGCCATTA GTkGCAmCaT GGTTaGTTAC GAAAACTGGA 
GATCCATTAG CmCCTGCGTA TTATTTAACA GCAATCAGTG TTATTGGCTT TTTAGTTATT 
ACATTCTTAC ATTTAAGTAC AGCAGGAAAA TCTCTAAAAG GTT CGTATCC AAATGTAGAT 



6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 
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GAACGTAAGA ATTAGAGATT TTAATaAAAA GT ATAAAT CA ATCGTATATA AGCACTTTAA 


8640 




AGCTAGTAGG TTCTGCTAAC TTTAAAGTGC TTTTTAAATT GAGAACTGTA ATTAGCCGTA 


8700 


5 


ATAAAGTTTT TGTATATACA TAAACCCCCA CTGCAATGAT TATCGCAATG 


GGGGAAAGAG 


8760 




GGGACTTAAA GCATATGTTT AGCTTTGAAT ACTTAAAATT CTCTTGCTAT 


TGAAATGTTA 


8820 




GGATGTAAAT ATGTCTTAGA GTATTTTGTC CAACGCAATT AATATTGAGA 


CTCTAACCTT 


3880 


10 


CAATATTATT ATAGAGAACA CAAACTTAAA TAGATTGGGT GACTTATTTG 




8940 




TGCGATTGCG ATAACTTCTT TTCTCTATAT ACATATAGTA ACGTCTTATC 




9000 


15 


CATGGTACTA CAGTATCAAA TTTATCTAGG GCTTAAGTTT GATTTTTATA 


AT AGG CAGGT 


9060 




TTACCTGATA AAAATACTTA TTCATTATAT AATGTTAACA ATATGTATTT 


T AAAGTTTA C 


9120 




ATTGAGTGAG GGATATTGAT GAACGTAATT TTAGAACAGT TGAAAACACA 


TACTCAAAAT 


9180 


20 


AAACCTAATG ACATAGCATT ACATATCGAT GATGAAACAA TTACATATAG 


TCAACTAAAT 


9240 




GCCCGCATCA CTAGCGCAgT TGAATCTTTG CAGAAATATT CACTTAACCC 


TGTCGTTGCT 


9300 




ATTAATATGA AATCACCGGT GCAAAGTATT ATTTGTTATT TAGCTTTGCA 




9360 




AAAGTGCCTA TGATGATGGA AGGTAAATGG CAAAGTACTA TACATCGTCA 




9420 




AAATATGGTA TTAAAGATGT AATTGGAGAT ACAGGTCTCA TGCAGAATAT 




9430 




ATGTTTATTG ATTCAACG CA ATTACAGCAC TACCCCAATT TATTACATAT 




9540 


30 


TCAGGGACAA CTGGACTGCC AAAAG CAT AT TATCGTGATG AAGATTCATG 




9600 




TTTGAAGTTA ATGAAATGTT GATGTTAAAA AATGAAAATG CAATAGCAGC 


CCCTGGACCA 


9660 


35 


CTATCGCACT CGTTAACATT ATATGCGTTA TTGTTTGCTT TAAGTTCCGG 


TCGTACTTTT 


9720 




ATAGGACAGA CCACTTTTCA TCCTGAAAAG TTACTTAATC AATGTCATAA 


AATAT CATCA 


9780 




TACAAAGTTG CTATGTTTCT TGTTCCAACG ATGATTAAAT CATTATTGTT 


AGTTTACAAC 


9840 


40 


AATGAACATA CAATCCAATC ATTTTTTAGC AGTGGAGATA AGCTGCATTC 




9900 




AAAAAGATAA AAAATCAAGC AAATGACATA AATTTGATTG AATTTTTTGG 


TACATCGGAA 


9960 




AC CAGTTTT A TCAGCTATAA CTTGAATCAG CAAGCACCAG TTGAATCAGT 


AGGTGTG CTA 


10020 




TTTCCAAATG TGGAATTGAA AACAACGAAT CACGATCACA ATGGTATAGG 


AACTATTTGT 


10080 




ATAAAAAGTA ATATGATGTT TAGTGGCTAT GTAAGTGAAC AATGTATAAA 


TAATGATGAA 


10140 




TGGTTTGTTA CTAATGATAA TGGCTATGTA AAAGAGCAGT ATTTATATTT 


AACGGGACGT 


10200 


50 


CAACAGGATA TGTTAATTAT TGGTGGTCAA AATATATATC CAGCACATGT 


TGAACGCCTT 


10260 




TTAACGCAAT CTTCGAGCAT TGATGAAGCA ATTATCATCG GTATT CCAAA 


TGAGCGTTTT 


10320 



55 
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CAATTTTTAA AAAAGAAAGT 


GAAaCgnTaT GAAATTCCAT CGATGATTCA 


TCATGTAGAA 


10440 


AAGATGTATT 


A CACTG CAAG 


tGGTaAAATT 


GCTAGAGAAA AAATGATGTC 


GATGTATTTG 


10500 


AGAGGTGAAT TATAATATGA ATCAAGCAGT 


CATAGTTGCA GCTAAACGAA 


CTGCATTTGG 


10560 


GAAATATGGT 


GGCACTTTAA 


AACATTTAGA 


GCCaGAACAA TTGCTTAAAC 


CTTTATTCCA 


10620 


ACATTTTAAA 


GAGAAGTATC 


CAGAGGTAAT 


ATCTAAAATA GATGATGTAG 


TTTTAGGTAA 


10680 


TGTTGTTGGG 


AATGGTGGCA 


ATATTGCAAG 


AAAAGCATTG CTTGAAGCGG 


GGCTTAAAGA 


10740 


TTCAATACCT 


GGCGTCACAA 


TCGATCGGCA 


ATGTGGGTCT GGACTTGAAA 


GTGTTCAATA 


10800 


TGCATGTCGC 


ATGATCCAAG 


CCGGAGCTGG 


CAAGGTATAT ATTGCAGGTG 


GTGTTGAAAG 


10860 


TACAAGTCGA 


GCACCTTGGA 


AAATCAAACG 


ACCGCATTCT GTGTACGAAA 


CAGCATTACC 


10920 


TGAGTTTTAT 


GAGCGTGCAT 


CATTTGCACC 


TGAAATGAGC GACCCATCAA 


TGATTCAAGG 


10980 


TGCTGAAAAT 


GTGGCCAAGA 


TGTATGATGT 


TTCAAGAGAA TTACAAGATG 


AATTTGCTTA 


11040 


TCGAAGTCAT 


CAATTGACAG 


CGGAAAATGT AAAGAATGGA AATATTTCTC 


AGGAAATATT 


11100 


ACCTATAACC 


GTTAAAGGAG 


AAATATTCAA 


CACTGATGAA AGT CTAAAAT 


CACATATTCC 


11160 


GAAAGATAAC 


TTTGGCCGAT 


TTAAGCCCGT 


GATCAAAGGT GGGACCGTTA 


CCGCTGCGAA 


11220 


TAG TTGTATG 


AAAAATGATG 


GTG CAGTTTT 


ATTGCTTATT ATGGAAAAAG 


ATATGGCATA 


11280 


CGAATTAGGT 


TTCGAGCATG 


GTTTATTATT 


TAAAGATGGT GTTACGGTAG 


GTGTTGATTC 


11340 


TAATTTTCCT 


GGCATTGGTC 


CAGTACCAGC 


CATTTCCAAC TTAC TAAAAA 


GAAATCAATT 


11400 


AACGATAGAA 


AATATTGAAG 


TCATTGAAAT 


TAACGAAGCG TTCAGTGCAC 


AGGTAGTTGC 


11460 


CTGCCAACAA GCTTTAAATA 


TTTCAAATAC 


GCAATTAAAT ATATGGGGTG 


GTGCATTAGC 


11520 


ATCAGGTCAT 


CCATACGGTG 


CAAGCGGTGC 


CCAATTAGTG ACTCGATTAT 


TTTATATGTT 


11580 


TGACAAAGAG 


ACTATGATTG 


CAT CTATGGG 


GATAGGGGGA GGTCTAGGAA 


ATGCAGCATT 


11640 


ATTTACTCGA 


TTCTAAC CAG 


CGATTAAATG 


TGTCATTTTC TAAGGATAGT 


GTGGCTGCAT 


11700 


ATTATCAGTG 


TTTTAACCAA 


CCTTATAGAA AAGAAGTACC ACCATTAATG 


TGTGCGTCAT 


11760 


TATGGCCAAA 


ATTTGATTTA 


TTTAAAAAAT 


ATGCAAATAG CGAACTGATT 


TTAACAAAAT 


11820 


CAGCAATTAA 


TCAAACTCAA 


AAGATAGAAG 


TAGACACAAT ATATGTAGGG 


CATTTAGAAG 


11880 


ATATTGAATG 


CCGACAGACT 


CGCAATATCA 


CACGTTATAC AATGGCTTTA 


ACATTAACTA 


11940 


AAAATGATCA 


ACATGTCATA 


ACGGTtACAC 


AAACTTTTAT TAAGGCGATG 


AAGTAGAGAT 


12000 


GGAGTTTAAT 


GAGATATGGA 


TAAATGAATA 


TTTGGCGCTC GTAAATGATG 


ATAATCCAAT 


12060 


ACATAATGAG 


ATTGTGCCAG 


GACAATTAGT 


GAGTCAAATG ATGCTGATGG 


CTATGTCATT 


12120 
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ATTCATTGAA 
AAAAATTTCT 
GGAGATGAAA 
AATATAGGTT 
CTATATCAAT 
CATATGATCT 
TGAATCGTCA 
TGCGCCTTCA 
TCTATGGTTA 
TTATCAGACA 
TATATATTTA 
GCATCTATCG 
CATCTTGAAA 
TATTGTT C GA 
AATTTAAATT 
GTTCATACCC 
CGTTAAACCT 
ACAGGACCAA 
TTCGCGCTAA 
GCAGCAAATG 
TGATAAAATG 
CCACCTTTAA 
ATATCTTCAA 
GGTGTCACTA 
TTAAGCACTT 
TTAGATGCCT 
GTTTTAATAG 
ATTGGTAATG 
AAAGCGACCA 



CAACACGAAC 
TTGAGCACAA 
GGACAGCTAA 
ACGTTTCTTT 
GTTTAATAAA 
ATATCGTCTT 
CATTTAATTG 
TGGTGATACT 
TATTATAAAT 
TAGAACGTAT 
TAGAGTCGCC 
CAAAAGAATG 
ATAAAGGGTT 
TATGTATGAA 
ATATACAGAG 
AATTTAAGTG 
CTGTTACTTC 
CAAAATCATT 
TCACAGCTTC 
TACAACCAGC 
TTTGACCATC 
TGATGACATG 
TTGAATTTAA 
CCGTTGCTTT 
CATCTTCGCC 
CATATACTTC 
CATCAGGTCC 
GTGTAACATC 
TGCCATACGT 



ACGAAATTAT 
AAAAATAACC 
TATCAGTTAT 
CTTTG CACGG 
TTCTGGATTA 
GTAATAAAGA 
AAACATGCTG 
GTCGATAAAT 
AACATTTTTA 
GATTTACTAA 
TGGCAGTCAT 
ATAATGATAG 
ATTTAGTCAT 
ATTTTCAATA 
CATGATGATT 
GTGTGGCTAA 
AACATCGATA 
CATTTTCCAA 
TTT CGGTGAC 
ACCATGGTTA 
ATAGTATAAG 
CTGTGCGCCT 
TTTACCTAAT 
AGGTAGTAAA 
TTTACAAACC 
TCCAGCACGT 
GATTGATAAA 
GTGTG AC CAT 
ATCTAATTCT 



AG C AATTAAT 
GATATTAGCT 
GTATTGTTAT 
GGATGCATTA 
TTGGAACGAT 
GAGCAATTTG 
AAACGTTTTG 
AATCATAACC 
TGTGTGACAT 
GACTATTTAT 
TTGGGaAATA 
AGGTATTGAG 
AGATGTAGAT 
AAAGCTAATA 
ATAAAAAAAT 
TAATGTTGAT 
TGTTCAATAC 
CCGTTTTTAA 
TTACCGTTAG 
TAACTTTGTT 
TCATACGATT 
TTATCAAAGA 
CCTGATAATT 
TATTTAATCA 
ATGACAGGAT 
TTGATTATCT 
GCCGTTTCAA 
GTATCTTTAT 
TGGAACGTTT 



GACGATGGAG 
GCATGAACGC 
TATTATTGGG 
ATCTAAAATA 
TAGTCAATTT 
AATATTTCAG 
GTTATAATTT 
TATATTACCT 
CAACCTTAAG 
GTATAAAAGT 
TAACATATAT 
CATATAGATG 
GTATAGGAAA 
ACGCTTATAT 
AACCACATCA 
TTATAGATGA 
GGTTGTATGC 
TAGCAGAAGC 
CTAAATATGC 
GGAACATGTC 
TATCTTGATC 
TAATTG TTGC 
GACCCGCTTC 
TCGCCTCAGT 
CTACTACAAA 
CCTCAGTACC 
GTTGTTTTTC 
CCATAGTAAC 
TCAAATCTGC 



AGATTAAAAT 
ATATTAATTA 
AACAGAGATG 
ATAATAACAA 
AACTAACTTT 
TATCACTAAA 
CATAAACTGG 
CCTTTGCTAC 
TAT CAACTTT 
TCTAAATAAA 
GATTAGAGAG 
AGTTTAAGTT 
TATTTGTATG 
GTAACTTTCA 
CATAAATTGA 
ACCGCCTAAT 
ACCGTGATCC 
GACGAAAGCT 
AGTTGTTGCC 
TGTTGTTAGT 
TAAAGCTTTG 
AGCCTTTTTC 
AAATAAGTTT 
ATTTCCAGGA 
ATATTGTGCA 
TAACATACCT 
AAATACATCC 
GATGGCAGTT 
TTGCATACcT 



12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
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CACTCCTACA 


TAATAATATT 


GTATTCATCA 




AGCATTCAAT 


ATTTGATGAT 


TGTTGAAATG 




TGTCATTCAC 


TTTAGATAAG 


TGTGATATGT 




AATGGTCGCA 


AATTTTTCAT 


GACATAACAA 


10 


TTTTAGAAAA 


AGAATATTCG 


ACTGCAATCG 




CGTTTGATTT 


AACACCGTTT 


GAAAATATCA 




ATGGTCCAAA 


CCAAGCACAT 


GGATTAGCAT 


15 


CAT CTTTACG 


TAATATGTAT 


AAAGAATTAG 




CGCATTTACA 


AGATTGGGCA 


AGAGAAGGCG 




GACAGGGTGA 


AGCAAATTCT 


CAT CGTG AT A 


20 


TTAAAGCAGT 


GTCTGATTAT 


AAAGAACATG 




AGCAAAAAAT 


AAAGCTTATC 


GATACATCTA 




GTCCACTGTC 


TGCATATAGA 


GGATTCTTTG 


25 


ATTTAGAGTC 


AGTAGGAAAA 


TCACCAATTA 




ATAGAGAAAC 


TTTAATAGCA 


CGAATTGAGC 




ATGACCATGA 


CTTTGAAAAA 


CATATGTATG 




CAACATCAAA 


TACACCACAT 


ATTGGTGAAC 




ATCAAATGCC 


ACAATCACAA 


ATAACGCAGC 


35 


AAGCGATGGG 


TGGTAAAGTA 


AATACGCATT 




AACCTTCAAA 


CCAACAACAA 


AGATTAGCGA 




TATETGATTT 


TTAAAAAGGA 


ACAATGAAAC 


40 


GGTTAATAAT 


CAAGACGCAT 


ATACTTTTAT 




ACTGAATTAT 


ATAAGGAGAG 


GTAGCAATGA 




CGATGATGGC 


TGTCGGTACA 


GGTGCATTTG 


45 


ATCACTATTT 


ATCAGTATGG 


GAAAAAGCAA 




TATTAATTAT 


AGGTGTAATT 


AGTGGTACAA 




TAATATTTGC 


TGGTATTATT 


TTCTTTAGTG 


50 


TTAAAGTTTT 


AGGTGCGATT 


ACGCCAATTG 




TGTTAATCAT 


TGCGACATTC 


AAATTTGCTG 



TATCATTTTT AAC CTAATTG AAAAATATTA 14 04 0 

AATCATTCAT ACTATTGTAA CTTTTGAAAA 14100 

TAAAATATGT CCTGAGGTGA GATTGAATGG 14 160 

CGAAACATGA CTTTAAAGCT ATGCATGATT 14 220 

TATACCCTGA TAG GGAAAAT ATATATCAAG 14 2 80 

AAGTTGTTAT ATTAGGACAA GACCCGTATC 14 34 0 

TTTCAGTGCA ACCTAACGCA AAATTCCCTC 144 00 

CAGATGATAT TGGATGCGTT AGACAAACAC 14 4 60 

TCTTGTTATT GAATACAGTT TTAACCGTAA 14 520 

TTGGTTGGGA AACATTTACT GATGAAATTA 14 580 

TTGTCTTTAT TTTGTGGGGG AAACCTGCAC 14 640 

AACATTGTAT TATAAAATCA GTGCATCCTA 14 700 

GATCAAAACC GTATTCCAAA GCGAATGCCT 14 760 

ATTGGTGTGA AAGTGAGGCG TAGATGTTGA 14 820 

AAGAATTAGT ACAAGCAGAG CAGGCACAGC 14 8 80 

CCATACATAT ATTAACATCT TTATATGCTT 14 94 0 

AACAAATGAA TCGTCGTATT GCTAACCATA 15 000 

CAACTCATCA AGTGACAGTT GCTGAAATTG 15060 

CAGCACATCA TCATAATAAG TCATATTCAC 15120 

CAGATGATGA CATTGGCAAT GGTGAATCCA 15180 

ATAATTACTT AATAGCTTGT TAAGTATGTA 15 240 

TCGAGTGTTC GGATTTAAAC ATTTATTAAT 1530 0 

AATTATTTAT TATTTTAGGT GCATTAAACG 15360 

GTGCGCATGG TTTACAAGGA AAAATAAGTG 15420 

CGACGTATCA AATGTACCAT GGCTTAGCAT 15480 

CTTCAATCAA TGTTAACTGG GCTGGCTGGT 1554 0 

GATCATTATA TATTTTAGTA TTAACTCAAA 15600 

GTGGCGTATT GTTCATCATT GGATGGATAA 15660 

GTTAAATTTT AAAACTTTAG ATTACCTATG 15720 
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TGGGTATAGA 
ATAGAGGCGA 
CATGTATCGG 
TTGCAGCATC 
ATGGCGCATT 
GTTTCGGCAG 
TCGTTGCTTT 
TAAATAATGG 
TTGCGACCGT 
GATCATTACA 
GTTCATTCTT 
AAGGATGGTT 
TTGATAATAT 
TTATCGTGTA 
GTTGGTTATC 
CACAAACAGC 
TATTTACTGG 
GTTCAGGTAT 
TCGCAATCAT 
TGACTTGGAT 
TGTGTGCAGC 
AAACGTTTGC 
CAGGTTCTCC 
TCGGTTTAAT 
TAAGTCG CTT 
AAAAAGAAAA 
ATCGTGCGAT 
TAATTGCTAA 
TTCACGAACC 



ATACCTTCGA 
TTTAAAACAA 
ATGGGGCGCA 
AATTGGTATA 
AGTAGAGAGA 
ATATGTGAGT 
AAAtGCGACC 
GAAA CTATAC 
ATTACTACTT 
ATATTATTTC 
TGGTAATAAT 
AGTGTCTATT 
TCCACAAACA 
CAGTTTATTA 
AACAAGTCAT 
ATTTGG TTAT 
TTTAAATGGA 
TATGC CAACA 
ATTCCTAGTA 
TGTAGATATG 
GAAATTATTC 
TATTATCGGC 
TGCAGCACTG 
ATTCTTTGTG 
GATTTTAAAT 
AACTAAATAA 
TTTTTGTATT 
GAGTTAGGGC 
CAGAAACAAT 



GGTGAGTTTT 
AACCTATCTG 
TTCATCTTAC 
GTTATTGGTG 
TTTCCAGTAT 
TTCTTCTCAT 
GCATTCAGTT 
ACCATTGCGG 
GTATTCATGC 
TGTGTGGCGA 
TTTGCACTTG 
GTGGTTATTG 
GCAGAAGAGT 
GCAGCATCAT 
CAAAGTTTAA 
ATTGGATTAG 
TTCTTGATGA 
ATGTTTAGTA 
GGAGTGTCGT 
TCATCTACTG 
AGTTATAACA 
TCATTTGTAT 
ACTGCACCGT 
ATTCGATATC 
AGAAGTGAAA 
TAAAAGAATC 
ATAAATTGAC 
TGAGCCATTT 
TAATTTGGAA 



TATTTATGGA 
AAAAGTTTGT 
CAGGAGACTG 
CATTATTAAT 
CAGGGGGCGC 
CATGGTTTTT 
TACTAGTTAA 
GCTGGGACGT 
TAGTAACGAT 
TGGTAATCGT 
AAAATTTACA 
TATCCGTGGC 
TTAACTTTGC 
TAACTTATGT 
ATGGGCAGTT 
GTGTATTAGC 
GTTCAAGTCG 
AATTACATAG 
TAATTGCACC 
GTGTATCCAT 
AACAAAGTAA 
CATTCATTTT 
CTTATATTGC 
CTAAATTGAA 
ATGAAGTTGA 
GCACAATAAA 
ATTTAAGACG 
CTAACAAATA 
ATTTGGTCGG 



AAAAAAGAAT 
ATG GGCGATT 
GATTAAG CAG 
GATATTAATT 
GTTTGCCTTT 
AACTTTTGGT 
ATTCTTATTG 
TTATATTACG 
TCGTGGCGCA 
CGTATTATTG 
ACCGTTAGCT 
ACCATGGGCA 
ACCAAACAAG 
TGTCATGATT 
GTGGTTAACA 
AATTGCAATT 
CTTGTTATTT 
TAAATACAAA 
TTGGCTAGGA 
TGCCTACTTT 
TACGTATGCA 
CTTAGCGTTG 
ATTACTTGGA 
AAATATGGAT 
TGATATGATT 
CCTTCTTCAT 
AGGCAGCTGA 
TTTATAATCG 
CGAATAATAA 



AAGCAAATAG 
GCATATGGTT 
TCAGGTCCGA 
GCGGTTAGTT 
AGTTTCTTAA 
TATGTCTGTG 
CCAGATGTCT 
GAAATCATTA 
AGTGTATCTG 
ATGTTCTTTG 
GAACCTAGCA 
TATGTTGGAT 
ACATTTAAGC 
TTATACA CTG 
GGTGCTGtTA 
ATGATGGGTA 
TCTATGGGAC 
ACAC CATATG 
AGAACTGCAT 
ATTACATGTT 
CCGGTTTACA 
TTATTAGTGC 
TGGTTAATCA 
AATGATGAAT 
GAAGAACCTG 
TCGGAGGCGT 
ACCTTATATA 
TTTAAAAGAT 
ACCTAATGCG 



15840 
15900 
15960 
16020 
16080 
16140 
16200 
16260 
16320 
16380 
16440 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16920 
16980 
17040 
17100 
17160 
17220 
17280 
17340 
17400 
17460 
17520 
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AAGACTAAAT TTTTTGTAGC ATCGTATGCT AAGCCACCAG GTACTAATGG AATGATACCC 17640 

GTTACCATAA AAATGATGGC AGGTTCTTTT TGTTTACGAG CCATATAATG ACTTAACAAG 17700 

CCTAATGCTA AACTACCAAA GAAACTAGAG TATATAGTGT GCACATTAAA GCCGTTGAAG 17 760 

AATAAGGTGT AAACCATCCA TCCACACGTA CCAACGAAAC CACATGATAG ATATAATTTT 17 820 

CTAGGTGCAT CAAAAATGAC GCAGAA 17846 
(2) INFORMATION FOR SEQ ID NO: 110: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5544 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 110: 





ATTGACACTT 


GGTGAAAGTA 


ATATCGCCGC 


GCTATTTTGG 


CAAAATGGAC 


ACTTAGAACC 


60 




TGAG TTACAA 


GATGAACAGC 


CAATTAATAT 


ATTAGGATCT 


GkTCAAATCA 


ACGAATGGAA 


120 


25 


TGGTAATCAA 


TCACCGCAAA 


TAATTATTCA 


AGATATTGCG 


ATGAATGAAC 


AGCAAATATT 


180 




AGATTATAGA 


AGTAAGCGAA 


AAAGTTTACC 


TTTTACAGAA 


AATGATGAAA 


ATATTGTCGT 


240 




GCTTATTCAT 


CCTAAAAGTG 


ATAAAGTAAA 


TGCGAATGAA 


TATTATTATG 


GTGAAGAAAT 


300 


30 


TAAACAACAA 


ACTGATAAAG 


TAGTATTAAG 


AGATTTACCA 


ACGTCAATGG 


AAGACTTGTC 


360 




TAATTCCTTG 


CAACAACTGC 


AATTTTCTCA 


ACTTTATATA 


GTTTTGCAAC 


ATAATCATTC 


420 




GATTTACTTC 


GATGGTATAC 


CTAATATGGA 


TATTTTTAAA 


AAGTGTTATA 


AAGCATTAAT 


480 


35 


AACTAAACAA 


GAAACAAATA 


TCCAGAAAGA 


GGGTATGTTA 


TTGTGTCAAC 


ATTTAAGTGT 


540 




GAAACCAGAT 


ACACTTAAAT 


TCATGTTGAA 


AGTTTTCTTA 


GACTTAAAAT 


TTGTAACACA 


600 




AGAAGATGGT 


TTAATTCGAA 


TCAATCAACA 


AC CTGATAAA 


AGATCGATTG 


ATT C CAGCAA 


660 




AGTATATCAA 


TTAAGACAAC 


AACGTATGGA 


TGTTGAAAAG 


CAATTATTAT 


ATCAAGATTT 


720 




TTCAGAAATA 


AAAAATTGGA 


TAAAGTCACA 


ATTGTCGTGA 


GCAATTTAGG 


AGGAAATATT 


780 


45 


AATGGATTTA 


AAGCAATACG 


TATCAGAAGT 


TCAAGATTGG 


CCGAAACCAG 


GTGT TAGTTT 


84 0 




CAAGGATATT 


ACTACAATTA 


TGGATAATGG 


TGAAGCATAT 


GGCTATGCAA 


CAGATAAAAT 


900 




TGTAGAATAC 


GCAAAAGACA 


GAGATGTTGA 


TATCGTTGTA 


GGACCTGAAG 


CGCGTGGCTT 


960 




TATCATTGGC 


TGTCCTGTAG 


CTTATTCAAT 


GGGGATTGGC 


TTTGCACCTG 


TTAGAAAAGA 


1020 




AGGGAAATTA 


CCTCGTGniAG 


TCATTCGTTA 


TGAGTATGAC 


CTAGAATATG 


GTACAAATGT 


1080 
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ATTAGCTACT GGTGGTACGA TTGAAGCAGC AATAAAATTA GTTGAAAAAT TAGGCGGTAT 12 00 

CGTAGTAGGT ATTGCATTTA TAATTGAATT GAAATATTTA AATGGTATTG AAAAAATTAA 1260 

AGATTACGAT GTTATGAGTT TAATCTCATA CGACGAATAA TAAATAATAT AATTTTATCA 13 2 0 

AATGAAATCC TTCATCAAAT GTATAAGAAC CAATGACTTA ATTAAAAAAG TTGTTTAAGT 13 8 0 

TTTCTTAACA TGAGATGTTA GGATTTTTTA TTTACTGAAA ATGTTAGATG ATTGAGCATT 144 0 

ATACCTTAAT AACATCGTTT ATTTATTTCA TAAATTG TAG TATCATAGAA CTAATATTTA 150 0 

AAAAATGAAA CAGTAGATTT AGGTCGAATT TTTGTAAAAG TTTTAAAAGT AGGAATAGTA 15 6 0 

TACAAATTAA ACTCGCTCAA GTAAAATTAA TATTACGATT AATGACGACA GGATAAATAT 162 0 

TTATCGTCGA CGGACGTATG ATTGGTGTGG GACAAATACT ATT CAACAAG AGTACCTAAA 1680 

TCATTGTTTA AGGCGAAGTA ATAAATATGA ATGGGGTGTA TCATATAATG AACAACGAAT 174 0 

ATCCATATAG TGCAGACGAA tTCTTCACAA AGCAAAATCA TATTTGTCAG CAGATGAATA 1800 

TGAGTATGTT TTAAAAAGCT ATCATATTGC TTATGAAGCA CATAAAGGTC AGTTCCGAAA 186 0 

AAA CGGATTA CCATACATTA TGCATCCTAT ACAAGTTGCA GGTATTTTAA CAGAAATGCG 192 0 

ATTAGACGGA CCGACGATTG TCGCAGGTTT TTTGCATGAT GTAATTGAAG ATACACCGTA 198 0 

TACATTTGAA GATGTAAAAG AAATGTTCAA TGAAGAAGTT GCTCGAATTG TTGATGGTGT 2040 

GACGAAGCTT AAAAAAGTAA AATACCGCTC AAAAGAAGAA CAACAAG CTG AAAATCATCG 2100 

CAAGTTATTT ATTGCGATTG CCAAAGATGT ACGCGTAATT TTGG TGAAAT TAGCAGACAG 2160 

ATTACATAAT ATGCGTACCT TGAAAGCCAT GCCGCGCGAA AAACAAATTA GAATTTCTCG 2220 

AGAAACATTA GAAATTTATG CACCATTAGC ACATCGTCTT GGTATTAATA CAATCAAATG 22 80 

GGAACTAGAA GATACGGCTC TTCGTTATAT TGATAATGTG CAATATTTTA GAATAGTCAA 234 0 

TTTAATGAAG AAGAAACGTA GTGaACGTGA AGCGTATATC GAAACGG CTA TTGATAGAAT 24 00 

ACGTACTGAA ATGGACCGAA TGAATATCGA AGGCGATATA AATGGTAGAC CTAAACATAT 24 60 

TTACAGTATT TATCGGAAAA TGATGAAGCA GAAAAAACAA TTTGATCAAA TTTTTGATTT 2520 

GTTGGCGATA CGTGTTATTG TCAATTCTAT TAATGATTGT TATGCGATAC TTGGGTTGGT 2580 

GCATACGTTA TGGAAACCGA TGCCAGGACG TTTTAAAGAT TATATTGCAA TGCCTAAACA 2640 

AAATTTGTAT CAGTCATTGC ATACTACAGT AGTAGGCCCA AATGGAGACC CGCTCGAAAT 2700 

CCAAATACGA ACGTTTGATA TGCACGAAAT TGCTGAGCAT GGTGTTGCAG CACACTGGGC 2760 

TTACAAAGAA GGTAAAAAAG TAAGTGAAAA AGATCAAACT TATCAAAATA AGTTAAATTG 2820 

GTTAAAAGAA TTAGCTGAAG CGGATCATAC ATCGTCTGAC GCTCAAGAAT TTATGGAAAC 2880 
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TGAGTTGCCA TATGGTGCTG TGCCGATTGA TTTTGCTTAT GCGATTCACA GTGAAGTAGG 3 0 00 

TAATAAGATG ATTGGTGCCA AGGTGAATGG CAAAATTGTA CCAATTGACT ATATTTTACA 3 0 60 

5 AACAGGCGAT ATTGTTGAAA TACGTACTAG TAAACATTCA TATGGACCAA GTCGTGATTG 3120 

GTTGAAAATT GTTAAATCGT CTAGTGCCAA AGGTAAAATT AAAAGTTTCT TCAAAAAACA 31 BO 

AGATCGTTCA TCTAATATTG AAAAAGGCCG AATGATGGTT GAAGCTGAAA TAAAAGAGCA 3 24 0 

10 

AGGATTTAGA GTCGAAGATA TTTTGACAGA GAAAAATATT CAGGTTGTTA ATGAAAAATA 3 3 00 

TAACTTTGCA AATGAAGATG ATTTATTCGC AGCTGTAGGA TTTGGCGGCG TGACATCCTT 3 3 60 

ACAGATTGTT AATAAATTAA CTGAAAGACA ACGTATTTTA GATAAACAAC GTGCTTTAAA 34 2 0 

15 

TGAAGCACAA GAAGTTACGA AATCATTGCC TATTAAAGAC AACATCATTA CTGATAGTGG 34 80 

TGTCTATGTA GAAGGTTTAG AAAATGTACT TATCAAGTTG TCAAAATGTT GTAATCCTAT 3 54 0 

2o ACCaGGTGAT GATATTGTAG GTTATATCAC CAAAGGTCAC GGTATTAAAG TACATCGCAC 3 6 00 

TGATTGCCCA AATATTAAGA ACGAAACTGA ACGACTAATT AATGTTGAAT GGG TAAAATC 36 6 0 

AAAAGACGCA ACTCAAAAAT ATCAGGTTGA TTTAGAGGTA AtGCGTATGA CCGAAATGGC 3720 

25 TTGTTGAATG AAGTACTACA AGCTGTTAGC TCGACAGCCG GCAATTTAAT TAAAGTTTCA 37 80 

GGACGTTCAG ATATTGATAA AAATGCAATA ATAAATATTA GTGTCATGGT GAAAAACGTG 3B4 0 

AATGATGTTT ATCGTGTGGT AGAAAAGATC AAACAACTTG GTGATGTTTA TACAGTAACA 3 900 

30 

AGAGTTTGGA ACTAGAGGTG CAAAATATGA AAGTAG TTGT A CAAAGAG TT AAAGAAG CAT 3 96 0 

CGGTGACGAA TGATACATTA AATAATCAAA TCAAAAAAGG ATATTGTTTA TTAGTCGGTA 4 02 0 

TCGGTCAGAA CTCTACAGAG CAAGATG CAG ATGTAATTGC AAAGAAAATT GCTAATGCAA 4 0 80 

35 

GATTATTTGA AGATGACAAT AATAAATTAA ACTTTAATAT CCAACAAATG AATGGTGAAA 414 0 

TACPATCAGT TTCACAATTT ACTCTCTATG CAGATGTAAA AAAAGGTAAC CGTCCAGGTT 4200 

40 TCTCAAATTC TAAAAATCCT GATCaAGCGG TAAAAATTTA TGAGTATTTT AATGcaTGCG 4260 

CTACGAGCGT ATGGTCTTAC TGTGAAAACA GGTGAATTTG GAACACACAT GAATGTTAGC 4320 

ATAAATAATG ATGGTCCAGT CACTATTATT TATGAAAGTC AGGACGGCAA AATTCAATGA 4 380 

45 AAAAAATAGA GGCATGGTTA TCTAAAAAGG GTCTTAAAAA TAAACGTACT CTAATAGTAG 4 44 0 

TGATTGCCTT TGT CTTATTT AT CATCTTTT TATTTTTATT G CTGAATAGC AATAGTGAAG 4 50 0 

ATAGTGGGAA CATCACGATA ACTGAAAATG CTGAATTACG TACAGGTCCA AACG CTGCGT 4 56 0 

S ° ATCCAGTCAT ATATAAAGTT GAAAAAGGTG ACCATTTTAA AAAGATTGGT AAAGTAGGTA 4620 

AATGGATTGA AGTTGAAGAT ACATCCAGTA ATGAAAAAGG TTGGATAGCT GGATGGCACA 4 680 

55 
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TAGTGCTTGA TCCTGGTCAT GGAGGTAGTG ACCAGGGTGC TTCAAGCAAT ACTAAATATA 4 8 00 

AAAGTTTAGA AAAAGATTAT ACGTTGAAAA CAGCAAAAGA ATTGCAGCGT ACTTTAGAAA 4 8 60 

AAGAAGGCGC AACTGTTAAG ATGACAAGAA CAGACGATAC ATATGTTTCA CTAGAAAATC 4 92 0 

GTGATATCAA AGGCGATGCC TATTTGAGTA TACATAATGA TGCGTTAGAA TCATCTAATG 4 98 0 

CAAATGGAAT GACaGTTTAT TGGTATCATG ATAATCAAAG AGCTTTAGCA GATACGTTAG 504 0 

ACGCTACGAT TCAGAAGAAA GGTCTACTTT CTAATCGCGG TTCAAGACAA GAAAATTATC 510 0 

AAGTGTTAAG ACAAACAAAA GTTCCTGCTG TTTTATTAGA ATTAGGTTAT ATTAGTAACC 516 0 

CAACTGATGA AACGATGATT AAAGATCAAT TACATAGACA AATTTTAGAA CAAGCAATTG 52 2 0 

TTGATGGCCT TAAAATTTAT TTTTCTGCGT AGGGCTTGCA AAAATATGTG AAAGTAGTTA 52 8 0 

TCATTGATAT TGAATTTTAT AACTAAAACC GTTAGTATTC TTGAAATGGT AAATGAAATA 534 0 

GGTAGCAATC TAACTAAGAT TGTGTAGGAA TATAATCCAT AGACTGAAAG ATTATGCTGA 54 00 

GTAGTTTATA TACATTGAAC ACAAGAAGAG GTG CTTTATG AAAAGTAAAG CCGTTAAACG 54 6 0 

TACGTTaAAC GTTTTGAGTG GGTTTATTAA ATGCACGCTT ATAAAAAGTA ATGATGATTA 552 0 

CAATTAGGCA TGTTTTTTAA ACCA 5544 
<2) INFORMATION FOR SEQ ID NO: 111: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1067 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 111: 

AAAAGATTGC AAATATAAAT GGCATGTTTA ATATGTTAGA ACAACAAATC ATTCATAGCC 6 0 

AAGATATGGC TCATTTTAGA AGTGAATTTT TTTACGTCAA TCATGaGCAT CGAGAAAACT 120 

ATGAAgCACT CCTAATTTAT TACAAAAATA GTATCGACAA TCCTATTGTA GATGGTGCAT 180 

GTTATATTTT AGCCCTACCT GAAATTTTCA ATAGTGTTGA TGTTTTCGAA TCAGAGTTAC 24 0 

CATTTTCATG GGTATATGAT GAAAATGGCA TTACCGAAAC AATGAAATCA CTTAGCATTC 300 

CATTACAATA TTTAGTTGCA G CAG CTTTAG AAGTAACTGA TGTGAATATA TTTAAGCCTT 3 60 

CAGGATTTAC AATGGGAATG AATAATTGGA ATATTGCTCA AATGCGAATC TTTTGGCAAT 4 20 

ATACAGCAAT TATTAGAAAA GAAGCACTAT AACATTAATA ATTAATTAGC TATAAAGATG 4 80 

ATTCACAACA ATCATCTTTA TAGCTTTTTT ATGTCTAATT ATTTTTGAGG AAAATmACAA 54 0 
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AATTTTATGT TTTCAAAAGT AAACAATCAA AAGATGTTAG AAGATTGCTT CTATATAAGA 66 0 

AAGAAAGTGT TTGTAGAAGA ACAAGGCGTC CCTGAGGAAA GTGAAATTGA TGAATATGAA 72 0 

TCTGAATCTA TTCACCTCAT TGGATATGAT AATGGACAGC CAGTTGCCAC TGCTCGAATA 78 0 

CGCCCTATTA ATGAAACAAC TGTCAAAATA GAACGAGTAG CTGTGATGAA ATCACATCGT 84 0 

GGACAAGGAA TGGGTAGAAT GCTTATGCAA GCTGTAGAAT CATTAG CTAA AGATGAAGGT 900 

TTTTACGTAG CTACTATGAA TGCCCAATGT CATGCTATCC CATTTTATGA AAGTTTAAAC 96 0 

TTTAAAATGA GAGGTAATAT ATTTCTTGAG GAAGG CATCG AG CAT ATTGA AATGACAAAA 102 0 

AAGTTAACCT CGCTTAATTA AAAAAAGTTG TATCTATTTT AGAAACA 10 6 7 
(2) INFORMATION FOR SEQ ID NO: 112: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 18613 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 112: 
AAGACGtACG ATAACAACAA TACgTGTAGT GAAAGATTTT AATCTACATA TTACTGACAA 6 0 

AGAATTCATT GTATTTGTTG GACCATCGGG ATGTGGTAAA TCAACAACAT TACGAATGGT 12 0 

TG CTGG ACT A GAGTCTATCA CATCTGGAGA TTTTTATATT GAT GGGGAAC GCATGAACGA 180 

TGTTGAACCA AAGAATAGAG ATATTG CGAT GGTATTTCAA AACTATGCAT TATATCCACA 24 0 

TATGACTGTT TTTGAAAATA TGGCATTTGG GCTAAAGCTA CGTAAAGTAA ATAAAAAAGA 30 0 

GATTGAACAA AAAGTTAATG AAGCAGCTGA AATATTAGGA TTAACTGAGT ATCTTGGTCG 36 0 

TAAACCAAAA GCGTTAT CTG GCGGACAGCG TCAACGTGTT G CTTTGGG CA GAGCTATTGT 42 0 

TAGGGATGCG AAAGTCTTTT TAATGGATGA ACCATTATCG AATCTTGATG CGAAyTtCGA 4 80 

GTACAAATGC GCACAGAAAT ATTGAAATTA CATAAGCGAC TTAATACTAC GACAATTTAT 54 0 

GTTACACATG ATCAAACTGA AGCATTGACG ATGGCTAGTC GAATTGTTGT TTTGAAAGAT 60 0 

GGCGACATTA TGCAAGTCGG CACACCTAGA GAAATATATG ATGCCCCTAA TTGCATATTT 66 0 

GTGGCGCAAT TTATCGGCTC ACCAG CAATG AATATGTTGA ATGCTACAGT TGAAATGGAC 72 0 

GGATTGAAGG TAGGAACACA CCATTTTAAA TTACATAATA AAAAATTTGA AAAGTTAAAA 7 B0 

GCTGCTGGCT ACTTAGA CAA GGAAATTATT TTAGGTATTC GAGCTGAAGA CATTCATGAA 84 0 

GAACCAATAT TTATTCAAAC TTCTCCAGAG ACACAATTTG AAT CTG AAGT AGTTGTATCC 900 
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AAATTAGATT CAAGAACTCA AGTGATGGCG 
AATAAGTGTC ACTTTTTTGA TGAAAAAACA 
5 ATGTCTAAAA TTTTAAAATG TATCACGTTA 

TGTGGCCCTA ATCGTTCGAA AGAAGATATT 
GACAAG CCTA ACCAACTTAC GATGTGGGTG 
AAAATTACGG ATCAATATAC TAAAAAAACT 
CAAAATGATC AACTAGAAAA TATTTCGCTA 

(£ TTTTTCTTAG CACATGATAA TACTGGAAGT 

AAATTATCAA AAGATGAGTT GAAAGGTTTC 
GACAATAAGC AACTAGCATT GCCAGCTATC 

20 AAATTAGTGA AAAATGCACC GCAAACGTTA 

ACTGATAGTA AAAAGAAACA ATACGGTATG 
TATCCGTTTT TATTCGGCAA TGATGATTAT 

25 ATTCATCAGC TAGGACTAAA TTCAAAACAT 

TGGTACGACA AAGGGTATCT TCCTAAGGCA 
AAAGAAGGAA AAGTAGGACA ATTTGTCACT 

30 

ACGTTTGGTA AAGATTTAGG AGTAA CAACA 
CCATTTCTAG GTGTACGTGG TTGGTATTTA 
AAAGATTTAA TGCTGTATAT CACTAGTAAA 

35 

AGCGAAATTA CTGGACGTGT TGACGTGAAA 
AAGCAAGCAC GTCATGCTGA ACCGATGCCT 

40 CCGATGGG CA ATG CAAG CAT ATTTATTTCA 

GAGGCGACGA ATGATATAAC GCAAAATATT 
AAAGGAGATT AGTTATGACG AAACGTAACC 

45 CTGGTTTGGG ACAGTTTTAT AATAAAAGAC 

TCATCAG TTT TATTTCTGTT TTTTATAGCT 
CATTAGGGAC AGTACCTAAG TTAGACGATT 

SO 

CTATCTTACT CGTTGCTTTC GCAATCATGC 
GTAATGCTGA A CGATTTAAT CGCAATGAGG 

55 



AACGACAAGA TTACACTAGC ATTTGATATG 1020 

GGAAATCGTA TCGTCTAAGG GGGAGTATTC 10 80 

GCCGTGGTAA TGTTATTAAT CGTAACTGCA 114 0 

GATAAAGCAT TGAATAAAGA TAATTCTAAA 12 00 

GATGGCGACA AGCAAATGGC GTTTTATAAA 1260 

GGCATCAAAG TAAAGCTTGT AAATATTGGT 132 0 

GACGCTCCTG CAGGAAAAGG TCCAGATATC 13 80 

GCCTATCTAC AAGGCTTAGC TGCTGAAATC 144 0 

AATArGCAAG CACTTAAAGC GATGAATTAT 15 0 0 

GTTGAAACAA CCGCACTTTT TTATAATAAA 1560 

GAAGAAGTTG AAGCTAATGC TGCCAAACTA 162 0 

TTATTTGATG CTAAAAATTT CTATTTTAAT 16 8 0 

ATTTTCAAGA AAAATGGCAG TGAATATGAT 174 0 

GTCGTCAAGA ATGCTGAACG ATTACAAAAA 180 0 

GCAACACATG ATGTCATGAT TGGTCTTTTT 186 0 

GGACCGTGGA ACATTAATGA ATATCAAGAA 192 0 

TTACCTACAG ATGGTGGCAA ACCTATGAAA 198 0 

TCTGAATATA GTAAACATAA GTATTGGGCT 204 0 

GATACATTAC AAAAATATAC AGATGAAATG 210 0 

TCATCTAATC CAAATTTAAA AG TGTTTG AA 2160 

AATATTCCTG AAATGCGACA AGTTTGGGAA 2220 

AATGGTAAGA ATCCTAAACA AG CGTTAG AT 2 280 

AAGATTCTTC AT CCATCACA AAATGATAAG 2 34 0 

CTAAATTAGC GGCATTATTA TCTGTTATAC 24 0 0 

CCATTAAAGG GACGATATTT TTTATCTTTT 24 60 

TTTTAAATAT TGGTTTTTGG GGATTGTTCA 2 520 

CTCGTGTCTT ACTTGCACAA GGTATTATTT 2 58 0 

TATATATCAT TAATATTTTA GATGCATATC 2 64 0 

AAATAAAGGA TCCGAAGcGC GTATGGTGGC 2700 
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TGTAGTTGTA TTTCCATTAA TAyyTATGTT TGGAGTAGCA TTTACAAATT ACAATTTATA 2 820 

CAACGCGCCT CCGAGACACA CATTAGAATG GGTTGGTTTA GATAACTTTA AAACGTTATT 2 88 0 

CACAATTGGC GTTTGGCGTA AAACATTTTT CAGTGTTATT ACTTGGACAT TAGTATGGAC 294 0 

GCTTGTTGCA ACGACACTTC AAATTGCATT AGGGCTGTTT TTGGCAATTA TTGTAAATCA 3 000 

CCCTGTCGTC AAAGGTAAGA AATTTATCCG TACTGTGTTA ATCCTACCTT GGGCTGTACC 3060 

ATCATTTGTG ACAATTTTAA TATTTGTAGC GTTATTTAAT GATGAATTTG GTGCGATAAA 3120 

TAATGATATT TTGCAACCTT TATTAGGTGT AGCACCAGCA TGGTTAAGTG ATCCGTTTTG 318 0 

GGCAAAAGTG GCATTAATCG GCATTCAAGT ATGG CTTGGA TTCCCATTTG TCTTTGCACT 3240 

GTTCACTGGA GTACTGCAAA GTATTTCATC AGATTGGTAC GAAGCAGCAG ATATGGATGG 3300 

TGCGTCTAGT TGGCAAAAGT TTAGAAACAT CACATTCCCG CATGTCATTT ACGCCACAGC 3 360 

GCCATTGTTA ATTATGCAAT ATGCAGGTAA TTTCAATAAT TTTAATCTTA TTTATCTATT 3420 

TAATAAAGGC GGTCCACCAG TGTCAGGGCA GAATGCTGGT AGTACAGATA TCTTGATATC 3480 

TTGGGTGTAT AATCTGACAT TTGAGTTTAA CAACTTCAAC ATGGGTGCAG TTGTGTCATT 3 54 0 

AATTATTGGA TTTATTGTTG CTATTGTCGC ATTTATTCAA TTCAGACGTA CAAGTACGTT 3600 

TAAAGATGAG GGAGGTTTAT AAGATGACAA AGAAGAAAAA CATATTAAAA GCAATCGGTA 3 660 

TTTACAGTTT TATAGCGATG ATGTTTGTCA TCATTTTATA TCCACTACTG TGGACATTTG 3 720 

GCATTTCCCT TAATCCAGGT ACGAACTTGT ATGGTGCCAA AATGATACCA GACAATGCAA 3780 

CATTTAAAAA TTATG CATTC TTACTATTCG ATGACAGTAG TCAATACCTG ACTTGGTATA 3 84 0 

AAAATACGCT TATCGTAGCA TCTGCAAATG CACTGTTTAG TGTGATATTT GTCACGTTAA 3 900 

CAGCATATGC TTTTTCTAGA TATCGCTTTG TTGGTCGTAA ATACGGGCTG ATTACATTTT 3 960 

TGATTTTACA AATGTTCCCT GTATTAATGG CAATGGTCG C AATCTATATT TTGCTAAATA 4 020 

CAATTGGATT ATTAGATTCT TTATTTGGAC TAACACTGGT ATATATTGGT GGATCAATAC 4 08 0 

CGATGAATGC CTTTTTAGTG AAAGG TTACT TCGATACGAT TCCAAAAGAA CTTGATGAAT 414 0 

CTGCCAAAAT TGATGGTGCA GGGCATATGC GTATTTTCTT ACAAATTATG CTTCCATTAG 4 200 

CTAAGCCGAT TTTAGCAGTT GTTGCTTTGT TCAATTTTAT GGGGCCATTT ATGGACTTTA 4 260 

TATTACCTAA AATACTATTA AGAAGTCCTG AAAAATTCAC ATTAGCAGTT GGATTGTTCA 4320 

ACTTTATTAA TGATAAGTAT GCAAATAATT TCACAGTGTT TGCAGCAGGG GCAATTATGA 4 38 0 

TTGCAGTACC TATAGCAATC GTATTCTTGT TCTTGCAACG CTATTTAGTA TCAGGTTTAA 4 44 0 

CAACAGGTGC GACAAAAGGT TAGTTTGAAA TTAGGAGTGG GGCAGAATTG ATAAAGAACC 4 50 0 
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GGGTGTGGTG GTATTGCGAA TGGCAAGCAC ATGCCAAGTT TACAAAAAGT TGAAAATGTT 4 62 0 

GAAATGATCG CATTTTGTGA CGTAGACATT TCGAAAGCAG CGAGTGCGGC AGAAGCATAC 4 68 0 

5 GGAACTGACA ATGCAAAGGT TTATGATGAT TACAAAGCAT TG TTAAAAG A TGACACGATT 4 74 0 

GATGTTATCC ATGTTTGTAC GCCAAATGAC TCGCATTGTG AAATTACTGT AGCAGGGTTG 4 800 

CATGCTGGTA AACATGTGAT GTGTGAAAAA CCAATGGCTA AAACGACAGC AGAAGCTCAA 4 860 

AAAATGATAG ATACAGCTAA ATCAACAGGT AAAAAATTAA CAATAGGTTA TCAAAATCGT 4 920 

TTCCGAGCAG ATAGTCAATT TTTACATCAA GCAGCGCAAC GTGGCGACTT AGGAGACATT 4 98 0 

( . TACTTCGGAA AGGCACATGC CATTCGTCGT CGAGCAGTAC CAACATGGGG TGTCTTTCTA 504 0 

GACGAAGAAG CTCAAGGTGG AGGACCATTA ATCGATATCG GTACACACGC TTTAGATTTA 5100 

ACGTTATGGA TGAT GGATAA TTATGAACCA GAATCAGTGA TGGGTTCAAC ATTC CAT AAA 5160 

20 TTAAATAAAC AG CAT CATGC GGCAAACGCT TGGGGTTCAT GGAATCCAGA TGAATTTACA 5220 

GTTGAAGATT CTGCGTTTGG ATTTATTAAA ATGAAGAATG GAGCGACGAT CATTTTAGAA 52 80 

TCCGCTTGGG CGATTAATTC TTTAGAAGTG GATGAGGCAA AATGTTCATT ATCAGGAACT 5 34 0 

25 AAAGCAGGTG CTGATATGAA AGATGGTCTA CGTATTCATG GTGAAGACAT GGGTACACTT 540 0 

TATACCAAAC ACGTTGAATT GGAAAACAAA GGCGTCGACT TTTATGAAGG TAATGAAGTG 54 60 

GATGAAGCTG AAGAAGAAGC AAAAG CTTGG ATTGATGCAG TTGTAAATGA TACTGAACCA 5520 

30 

GTTGTGAAAC CGGAACAAGC AATGGTAGTT ACAAAAATTC TTGAAGCGAT TTATCAGTCT 5 58 0 

GCAAAATCAG GCAAAGCAAT TTACTTTGAA TAACATCATA CGGTAAGGAG GCACATCATG 564 0 

ACAAAATTAA AAGTTGGTGT GATAGGTGTT GGTGGTATTG CACAAGACCG TCATATTCCA 5700 

35 

GCATTGCTGA AACTCAAAGA CACAGTCTCA TTAGTTGCAG TACAAGATAT TAATACAGTG 5760 

CAGATGATTG ATGTTGCGAA gCGCTTTAAT ATACCTCATG CAGTTGAGAC ACCTAGCGAG 5820 

40 CTGTTTAAAC TTGTTGATGC GGTGGTCATT TGTACACCTA ATAAATTCCA TGCTGATCTT 58 80 

TCTATAGAAG CATTGAACCA TGGTGTCCAT GTATTGTGTG AAAAGCCAAT GGCGATGACG 5 940 

ACGGAAGAGT GTGATCGCAT GATTGAAGCG GCTAATAAAA AT CACAAATT ATTAACTGTC 6 00 0 

45 GCATATCATT ATCGTCACAC AGATGTGGCA ATTACTGCTA AAAAAGCAAT TGAATCAGGT 6060 

GTGGTTGGTA AACCTTTAGT AGCACGTGTA CAAGCGATGC GTAGGCGTAA AGTGCCTGGC 6120 

TGGGGTGTTT TTAC CAATAA AGCGTTGCAA GGTGGCGGTA GTTTAATCGA TTATGGTTGC 6180 

50 

CACTTGTTAG ACTTATCTTT GTGGCTACTA GGTAAAGATA TGGTGCCGCA TGAAGTGCTA 624 0 

GGAAAAACAT ATAATCAATT GAGCAAACAA CCGAATCAAA TTAATGATTG GGGAACATTT 6300 
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GCAAGCATGC AGTTTGAATG TTCGTGGTCT GCAAATATCA AAGAAGATAA GGTTCACGTT 64 20 

AGTTTAT CAG GAGAAGATGG CGGTATCAAT TTATTTCCAT TTGAAATATA TGAGCCCCGC 64 80 

5 TTTGGAACTA TTTTTGAAAG CAAAGCTAAT GTTGAGCATA ACG AAGA CAT TGCTGGTGAG 6 54 0 

AGACAGGCGC GTAACTTTGT CAATGCGTGT TTAGGGATAG AAGAGATTGT GGTGAAACCG 66 00 

GAAGAAG CAC GCAATGTAAA TGCCCTTATA GAAGCGATTT ATCGTAGCGA TCTTGATAAC 66 60 

10 

AAGAGCATAC AACTTTAATG ATTATCATAT ATGATACAAA ATTCTCAATA TAAAAAGAAG 67 20 

GAGTGCTTTT CAATGAAAAT AGGTGTATTT TCAGTATTAT TTTACGATAA AAATTTTGAA 67 80 

(S GATATGTTAG ATTATGTCTC AGAATCTGGA TTGGATATGA TTGAAG TTGG AACAGGTGGT 684 0 

AAC C CAGGAG ATAAATTTTG TAAGT TAGAT GAGTTGTTAG AAAATGAAGA CAAG CGCCAA 69 0 0 

GCATTTATGA AGTCAATCAC AGACAGAGGC TTACAAATAA GTGGTTTCAG TTGTCATAAC 696 0 

20 AATCCAATTT CTCCAGATCC GATAGAAGCG AAAGAAGCCG ATGAAACGTT ACGTAAAACA 702 0 

ATCCGTTTAG CAAATCTATT AG ACG TGCCA GTTGTTAATA CATTTTCTGG CATTGCAGGA 708 0 

TCAGATGATA CCGCTAAAAA GCCTAATTGG CCTGTTACAC CTTGGCCAAC AGCCTACTCT 714 0 

25 GAAATTTATG ATTATCAGTG GAATGAAAAG TTGATACCAT ATTGGCAAGA TTTAGCTGAG 720 0 

TTTGCAAAAG AG CAAG ATGT AAAAATTGCC ATAGAGTTGC ATGCAGGATT TTTAG TGCAT 72 6 0 

ACACCATATA CAATGTTGAA GTTACGTGAG GCTACAAATG AATATATCGG TGCTAACTTA 732 0 

30 

GATCCTAGTC ATCTATGGTG GCAAGGTATT GACCCAATTG CTGCGATTCG CATATTAGGC 73 8 0 

CAAGCAAATG CAATTCATCA CTTCCATGCT AAAGATACGT ATATTAATCA AGAAAATGTA 744 0 

AATATGTATG GTCTAACTGA TATGCAACCA TATGGTAACG TTGCGACAAG AGCATGGACA 750 0 

35 

TTCCGTACAG TTGGTTATGG ACATAGTCCA TATGTATGGG CAGATATCAT AAGTCAACTT 756 0 

ATTATTAATG GATATGATTA TGTATTAAGT ATTGAACATG AAGATCCTAT TATGTCAGTA 7620 

40 GAAGAAGGTT TCCAAAAAGC TTGTCAAACT TTGAAATCTG TTAATATTTA CGACAAGCCA 768 0 

GCAGACATGT GGTGGGCATA ATACGAACTC GAGGTTAGTC TGAAGTTTGT CTGAAGTAAG 774 0 

ACTGGTGGCA GTGTTGAATA AATGCATATG TCGCCAAGCC ATTGCCAAAA ATTTCACACC 7 80 0 

45 TTAAAT CAAG TCATTGTTTG TAAAGAAGGT GTACTTTATA TAAGTATATA GCGATGGTCA 7 860 

TACCCATTCA CAGTAACAAT CCTCACCATT GAAAAGAGTA TATAACCTTT TCAATAGTGA 7920 

GGTATATGAT AATAAAAAAA GCCTGTTGTC ACAATGGTCA TAGACACGAC ATACTTTAAA 7 98 0 

SO 

GGTTTCTGAA TATAATATTT CAGAATGCAC TTTAAAGATG GACGTCGATG TAGACTAAAG 804 0 

TGATGACAGG CTTTCATCTT TTTAAATATT CATTAATTTC TCTTCTTGTT TAATACGTAC 8100 
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TAATACACCG ATTAATTCAG GAATGATGTT 
ATATAATCCA GATTTAATAA TAGGATGGTT 
5 ACCAC CTAAA GTTTTAATAA CCATAAATAA 

GCCAATACCA TTTGCAAAGC TAAATGTATC 
TACATAAATT AAAACGTGTG TTATTGCTAA 

10 

TGCACCGTCT GCTTTTAATT GTTTTGAGTG 
GATACAGAAA AAGATAAGTA ATATAGATAG 

is TGTATAAGCG TTGATTTTGA CAACATAAAG 

TTAACTATTT ATTAATTTTA GTACATAAAT 
TTTTGGATAA TTTAATAATT TTAAGGATAT 

20 CTTAACGAAA ATGATTGAGG TGACAGAGAT 

CAAAGGCATT CCATTATCGG TACAACGTAA 
CTTCGTAGTG TTCTTTGTTT ATATGG CTAT 

25 ACAACCGTTT TTAAAAGAGG AAATTGGATT 

AGCATTTAGT ATCACGTACG GTTTAGGAAA 
TAACACAAAA CGTATTATCT CGTTCTTACT 

30 

GGGATTTGTT TTAAGTTACT TTGGTTCTGT 
TAACGGGGTG TTCCAATCAG TTGGTGGACC 
GCCAAGAACG AAACGTGGCC GATACTTAGG 

35 

TGCCATAGCA GGTGGTGTTG CACTTTGGGG 
AGGGATGTTC ATTTTCCCAT CGGTGATTGC 

40 CGGAAAAGAT GATCCGGAAG AATTAGGATG 

GGTCGATAAA GAAAATATTG ATTCTCAAGG 
TATCCTGGGA AATCCTGTTA TATGGATTCT 

45 ACGAATCGGT ATTGATAACT GGGCACCGTT 

AGGCGATGCA GTTAATACGA TATTCTACTT 
ATGGGGCTAC GTATCAGACT TATTAAAAGG 

50 

GTTTATGATT ACATTTGTTG TCTTATTCTA 
CATTTCATTG TTTGCATTAG GTGCGTTAAT 



TAAGAAGTAA TTTGGGTGTT TTGTAATTTT 8 22 0 

AGG TAAAATG AATAATTTTA ATGTCCAAAT 8 2 80 

CATGATATAA G CAAAG ATTA ATATAACTAA 8 34 0 

TTTATTAATA AATGCCTCTA CACCAGCCAA 8 4 00 

AAACTTCGAA TTTTTAACGC CATATTCAAC 84 6 0 

ATTAATAGAT ATCTTTAAGC TGACAAGTCT 8 520 

AAT CATGATG TCCTCCGTCA TTATGTCATA 8 5 80 

TATTTTATAG ATAAAGCTTG T CAAAT A CTA 8 64 0 

ATGTTT CTAA GTATGTGTTT ATGTTCAGTA 8700 

TAAGCGCTTA CACCGACGTG ATATATTTGG 8760 

GAACTTTTTT GATATCCATA AGATTCCGAA 8 82 0 

ATT ATGG CTT AGAAACTTCA TGCAAGCTTT 8 8 80 

GTATTTAATT CGAAACAACT TTAAGGCGGC 8 94 0 

ATCTACATTA GAACTTGGTT ATATCGGATT 90 00 

AACATTACTT GGATATTTTG TCGATGGACG 90 60 

TATCTTATCT GCGATTACAG TTTTAATTAT 9120 

AATGGGATTA TTAATTGTAC TTTGGGGACT 9180 

TGCAAGTTAT TCAACGATTT CAAGATGGGC 92 4 0 

ATTCTGGAAT ACATCACATA ATATCGGTGG 93 00 

TGCTAATGTA TTCTTCCATG GAAATGTTAT 93 60 

ATTACTTATT GGTATCGCAA CATTATTTAT 94 20 

GAATCGTGCT GAAGAAATTT GGGAAGAGCC 94 80 

TATGACGAAA TGGGAGATCT TTAAAAAATA 9540 

ATGTGTTTCA AACGTCTTTG TATACATTGT 96 00 

ATATGTGTCA GAGCATTTAC ACTTTAGTAA 9 6 60 

TGAAATTGGT GCATTAGTTG CAAGTTTATT 97 20 

TCGTCGTGCA ATTGTAG CTA TTGGCTGTAT 97 8 0 

CACAAATGCT ACAAGTGTCA TGATGGTTAA 9 84 0 

CTTTGGTCCG CAATTATTAA TTGGTGTATC 9 900 
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CGCGTATCTA 
ACGTAACGGT 
CTTCTATGTT 
AAAGAAAATT 
TGCAATATAG 
TTCTACCCTT 
AAGTATCCTT 
ATATAGCGGT 
ACTGAAAGAA 
GCCATAATCA 
ATTTGTAAAT 
TCTGCAATTT 
TAGCGATTTA 
TACGATTCAC 
GATTGCTTAA 
AGTGGTTGGA 
AATAAGGTAC 
AATAAATAAT 
CTCGATAATA 
TTTTTACGTG 
GATAATGCTT 
GGAATGATTT 
AACATCTACA 
CTTTGAAAAA 
ATGATTTAAT 
TTGCAGGCGA 
ACGTG C CAAT 
AGCATTTTCT 
AGAACTTTCA 



TTCGGTGACT 
TTAAACATCT 
GCATTATTCC 
AGAAGTTTAA 
TTGGCAATCC 
GCAAATATAT 
ATTTG CCCGA 
GTCAATATTG 
AAGTGAAAAC 
TTAGTTATGT 
ATTTTTTAAA 
CATAGTGTTT 
AATAATCGAC 
TAACATCGAT 
TTTGATCCAC 
AGGCATCATG 
GGACAAGTCT 
CAAGAACATG 
TGATGACATT 
GCATACGAAT 
CAACACCATC 
GCTTTAATC C 
TTCCCCCTTG 
ATATGGAGTC 
CCCAAATGCT 
GATGACGACA 
GTCAGGCGTA 
ATGAGTGGCT 
ATATGGAGCT 



CAATGGCGAA 
TTGGATATAC 
TAGGCATGAT 
AAATTTAATA 
TGCCCCGACG 
CATCTCTATG 
CTTAGGGTGA 
TAGGGAGTAT 
TTCTCTATCA 
GCTAATCTAT 
ATGATAGCTA 
GTAATGTCGA 
AATTGTAATA 
ATGTTGAATT 
AATCTGGTTT 
ACAAGATGCT 
TCCTAAAATA 
ATGTTGAATG 
ACAATCTAGA 
AT CAGTAATT 
TTTAGCAGTG 
TTCTCGAATA 
AAAGTGGTAT 
GTGCATGTGA 
TAGTATCAAA 
TCCCGATACC 
TAGTAATGTC 
GAAGCATCAT 
TAATCATGTC 



AGTTGGTTTG GCGGCTATTG 
ATTAAGTGGA TGGACAGATG 
TCTATTAGGA ATCGTTGCTT 
TAAATCGGAT TAAAAGTATC 
GCATGTGCGT GAAGAGATGA 
TCTCGGGGCA GATCATAATT 
CTCAATGAAT TTACTCCTTA 
TGTTTTATAT TTAAACTCTC 
GTCCGCTTTT TCATAGAACA 
TTTGCTTGCT TACAATAATC 
AACATTTTAT ACTCTGAAAA 
TCTAACAATT GCAGAGATTG 
CCAACATGAT CTTTAAATGT 
AAATCTGAAA CAGtCACTTT 
ACATAATAAT CATCGTATTC 
AAGCTACGGC CGTTCTGTGA 
ACTT CTAATT GTGCATGGTC 
CCGGCTTTCA TATATTCAAA 
TGCGCAATAT CATTGAGTAA 
ACTAATTCTG GCTGATGTTG 
TATATTGTAT TGAAATGATA 
ATTCGTTCAT CATCACAAAT 
TTTATAACAA ATTAACGTAC 
ACCATATTGA AT CATTGCTT 
TACATCATTA TTAAGAGATT 
ATTGTCGCAA ACTAAAACAT 
CAATGACTCA GTATCTCTAC 
TTTACCAATT GTCTGGTGAC 
ATCAAAACGG aTGTTTTGTA 



CTGATCCAAC 
TTTTCATCGT 
TCTATGAAGA 
GCCAATCTAT 
AAGATACTGC 
CCCTGTTATG 
CAATAAAGAC 
TAAAAAGCGG 
AAATGGAGGC 
ACTTGGCGAC 
GCCTACTTTG 
TAAAATACGA 
TCGCATCGCA 
CGTTTGATAA 
TACTTTTAAT 
TTGTTGCTCT 
TACTGGTTTT 
GTCATCGTAA 
ATCGACGCCA 
TTGAATTAGT 
GTCTCCCCAA 
AACTACCTTA 
CTTGATTACG 
TATTGTGTAA 
GGCGTACATA 
GTAAATTCTG 
CATGTTTAAT 
GCGCTTCTTC 
TTG CAACAT A 



10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
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GTAACGTAAC ATTTG CGATA ATTGTTGGAC CACAGTTtGT GCTAATTTCG GAGATAACGT 11820 

AATTAAATAT TGTATTGTTT GCATCGTATT GAATAGGAAA TGAGGCTGGA ATTGGCGTTC 118 80 

5 TATTTCCTTT AACTGAATAT CACGCAAGCG ACGTTCTGTA TGCTCGATAG AATGGATCAG 11940 

TTGCTCATTT GATTCAAATA AATCGTAAAT ATAATTATTA ATTTCTTCTA GTTCACTGTT 12 000 

GTTTTTTAAA GGCGTATATG TACCTAGATG ACGATTTTTG GCATAGTAAA TTTTTTGAAT 12060 

w 

AATCGTTTCG ATATCTTTTG TTTGTCGTTT AG CCATATTA TCTGCGCTAA TGAAACCAAA 12120 

TATTACTAGT AAAACAAGAA CTACGGCCAT AACAATTAAC AACGTGATAC CATCTT CAAT 1218 0 

GTTTTCATGT ATATCTTTAT AAATAATGAG ACGATGGTCA GCATGGTTTA ATTTTACAGA 12240 

TT CATTCATA AATCCGAATT GTTGTGGTcT ATACTTTTCA CCTATAGTAA AACGGTCATC 12300 

GTTGGCGTAT AAAATATTGT CATATTGATC AmCGATAAGT GCGAATTGTC GGTTATCTTT 123 60 

20 CtTAATTTCA CTTAAACGTG GGGTGTtAGC CATATAAAT t TTaAGCATAT ATGTACTATT 12420 

TTTGAATTTA AGCTGATGCG TTGAAAATAA ATACATATTT TTAGTGTTTA AATGTTCATA 124 80 

ATTATTGGTT ATAAACTGAT TTGGTCCAGA TAATTCATAA TAAAGTG TTG CGGGCTGTTG 1254 0 

25 GkG TATTAAT TTTAATAATT CACGTTTTGT AGCGGTCACA TCATGATGAT TTGyTAAATC 126 00 

GAGCTCTTGA AACGAATTAT TATGCTGTGT AATAAATGTC TGAATCTGCT TTTCAGTATG 12 6 60 

ATG TAAAGAT GACTGACTTT CATCAACATG TTGATGAATC GTACGATGCT CAATCCAAAT 12 7 20 

50 ATAGATGGCA TAGAAGCTTA CTAGTCCAAT AATAATGACT AAAAATACTG GAAAAATAGT 12780 

AGACnCAAAT AACGATCGTC TTAATTGATG TCTATAAGGT TTGTATGCCn TCATTGAATC 12840 

ATCTCCAAAA ATTTATGATG TGGAATATCC GGTAATTTAG ATTTCGGTAT TAAAGGTATG 12900 

35 

TTCTTAAGAT TTTCGATAGA CTGATCGCTT TGTTCACTAA CATCCTTTCG AATTGACTTG 12 960 

G CATCGAACT CTGCAACTAA TCGTt GTTGT ACTGAGCGGC TTGTTAAATA TTGCACTAAC 13 020 

4q TTTTTACGCT TAGGATGAGG GTGTGCATTT TTAACTAAAG CAATrCCATC AACATTTAAC 130 80 

ATTGTTCCTT CAATTGGATA AACGATTGAT ACAGGATAAC CTTTGTTTTT CCATGTGCGT 1314 0 

G CATC TTGTT CGTAGCTTAG ACCTG CGTAA TATTTAC CTT TTGCAACATC TTCAATGACT 1320 0 

45 TTAGACGTCT TTGACAGTTG CATCGCATGG TTTTGGAATT GATG CACATC ACTTACT CGA 13260 

TGATG CATGC TATAAATAGC ACGCATATGT TGATAGC CTG TCGTTGTTGT ATTTGGATTT 13 32 0 

GAGTACGCAA TTTTACCTTT AAGTATAGGT TGTAATAAAT CTTGATAACC TCGAATCTTA 133 80 

50 ATATCTCCTT GTAAATCTGA ATTCACTACT ATAACTGTTG GCATTAATAG AAAACTAGTA 1344 0 

ACATATTTAT TGTTCGAGCG AT AAT CCTCT AATTGCTGTG TTACAGATGT ATCTTGATAG 13500 
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CCACGCTCCG AAAAATCTTC GTTATGCAAG 
TTAATTTCAA TTTTGACATG CTCTTGTTTT 
5 TTTGATTGAT A CGG AGAATA AACTGTTAAT 

TTAGCGCATG CTGaTAAAAA AATGAGAAAT 
ATATCCCATC AATTCTATGT ATATTTTAAT 
GTAATGTTAA ATATTTAGAA ATGTTTATAG 
ATAGCACAAA ATTTTTGTTT GTCAAGACGA 

1S ATTTTATTTG TAG CTGTTAT ATAAAAATCG 

TTTACGTCAA TAAAAGTATT TAATCCAGTC 
TGTTGATTTA ACGCTTATCA ACAATCATTT 

20 CTTTTAAAGC AATGAAAATA GTGAACATTA 

TATTACTGTT ACACAAATTA GTACAGTTTC 
TACATAATTT ATGTGAAAAA AATCACAACA 

25 CATAGCATTT CAAATTCACA ACATTATACA 

TaAAAATCAT GCAACAGCTT GGCAAGGATT 
TGTAAGAGAG TTTATCCAAT TAAACTACAC 

30 

AGGACCAACA GAAGCAACTT CTAAACTTTG 
ACGTGAACGT GGCGGCATGT GGGATATGGA 
TGATGCTGGT TATTTAGACA AAGATTTAGA 

35 

ATTCAAACGT TCAATGCAAC CATTCGGTGG 
TTACGGTTAC GAATTAGACG AAGAAACTGA 

40 TAACCAAGGT GTATTCGATG CATATTCTAG 

AATCACTGGT TTACCTGATG CATACGGACG 
AGCTTTATAT GGTGTAGATT TCTTAATGGA 

45 TACAGAAATG TCAGAAGATG TAATTCGTTT 

ATTAAAAGAA TTAAAAGAAC TTGGACAAAA 
AAACTTCAAA GAAGCAGTTC AATGGTTATA 

50 

AAACGGTGCA GCAATGAGTT TAGGTCGTAC 
TGACCTTAAA GCAGGCGTTA TTACTGAAAG 

55 



TTTGAAAGCA GTACTTGAGT AGATCCGTGT 13620 

TCAAATTCAT TTAAAATTGG ACGAATCAAG 13680 

ACATTTTTAT CGGATTCAGA GTGACGCGTA 13 740 

AATAGCAAGA TATAAATTTT TGATTTCATG 138 00 

ACAATAATTT TAGCAATAAA TGACGCATAA 13 860 

ATGACTTGTT AAGACGTTGC AAATGTTGTG 13 920 

TTTACCGAGG CTGTAAAATC AAACTGTTAT 13 980 

GCAAGATATT GAACGGTTCA AAAGTGAATT 14 04 0 

TCTTCATATA TAAAAGTAAA TCTTTCTAAG 1410 0 

TTTATAAACA AATATATACT CCTAAATTAA 14160 

TAACTGTTGT GTAACAGAAT GCAATTAGCA 14 220 

TATGTTTTGA CATACATTTG ATGAAAATTG 14 2 80 

AACATGCTAC AATGACTATG AAAACGTTAA 1434 0 

GATGGAGGCG TTTAGTATGT TAGAAACAAA 14400 

TAAAAATGGA AGATGGAACA GACACG TAGA 14460 

TCTTTATGAA GGTAATGATT CATTTTTAGC 14 520 

GGAACAAGTA ATGCAGTTAT CGAAAGAAGA 14580 

CACGAAAGTA GCTTCAACAA TCACATCTCA 14 640 

AACAATTGTA GGTGTACAAA CTGAAAAGCC 14 70 0 

TATTCGTATG GCGAAAgcAG CTTGTGAAGC 14 760 

AAAAATCTTT ACAGATTATC GTAAAACACA 14 82 0 

AGAAATGTTG AACTG C CGTA AAGCAGGTGT 14 880 

TGGACGTATT ATCGGTGACT ATCGTCGTGT 14 94 0 

AGAAAAAATG CACGACTTCA ACACGATGTC 15000 

ACGTGaAGAA TTATCAGAAC AATATCGTGC 15060 

ATATGGTTTC GATTTAAGCC GTCCAGCAGA 15120 

CTTAG CATAC CTTGCTGCAA TTAAAGAACA 15180 

ATCAACATTC TTAGATATCT ATGCTGAACG 15240 

CGAAGTTCAA GAAATTATTG ACCACTTCAT 15300 
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AGACCCAACT TGGGTAACTG 
TACGAAAAAC TCATTCCGTT 
AAACTTAACA GTATTATGGT 
AATGAGTATT AAAACAAGTT 
TGGCGATGAC TATGGTATCG 
ATTCTTCGGT GCACGTGCGA 
AGATGAAAAA TCTGGTGCAC 
AGAATATGAC GAAg TATTCA 
CATTAACTCA TTAAATGTTA 
AATGG CATTA CATGATACAG 
AGTAGCAGCT GACTCATTAT 
AGAAGGTCTT GTAGTAGACT 
CGACCGTGTA GATGATATTG 
TCATAAAACA TATCGTGATT 
TGTATACGGT AAGAAAACTG 
TCCAGGTGCA AACCCAATGC 
TGTAGCTAAG ATCCCTTACG 
ACCAAAATCA TTAGGTAAAG 
TGGTTACGCA ATGCAATGTG 
AATAGATGCA ATGGAACATC 
CGCI&TTAAC TTCATTAAAT 
CCAf GAAAGT ATGTAACAAA 
CTGTCGAAAG TTTAGGTACT 
GATGCTTACT TAGATGCTTG 
CAAGAGAAGT CACAGTTGAT 
ATGCATC GGG TGGCGGTGTA 
TAGAAAAATT ATTTGCAGAA 
CTGGATGTGC TAATGATACA 
CAGACTTGAT ATTATTAGAT 



AATCTATCGG TGGTGTAGGT ATTGACGGAC GTCCACTTGT 15420 

TCTTACACTC ATTAGATAAC TTAGGTCCAG CTCCAGAACC 15480 

CAGTACGTTT ACCTGACAAC TTCAAAACAT ACTGTGCAAA 15540 

CTATCCAATA TGAAAATGAT G ACATTATG C GTGAAAGCTA 1560 0 

CATGTTGTGT ATCAGCGATG ACAATTGGTA AACAAATGCA 15660 

ACTTAGCTAA AACATTACTT TACGCTATCA ATGGTGGTAA 15720 

AAGTTGGTCC AAACTTCGAA GGTATTAACA G CGAAGTATT 15780 

AGAAATTTGA TCAAATGATG GATTGGCTAG CAGGTGTTTA 15840 

TTCACTACAT GCACGATAAA TACAGCTATG AACGTATTGA 15900 

AAATTGTACG TACAATGGCA ACAGGTATCG CTGGTTTATC 15960 

CTGCAATTAA ATATGCACAA GTTAAACCAA TTCGTAACGA 1602 0 

TTGAAATCGA AGGCGACTTC CCTAAATACG GTAACAATGA 16 080 

CAGTTGATTT AGTAGAACGC TTCATGACTA AATTACGTAG 1614 0 

CAGAACATAC AATGAGTGTA TTAACAATTA CTTCAAACGT 162 00 

GTAACACACC AGACGGACGT AAAGCTGGCG AACCATTTGC 162 60 

ATGGC CGTG A CCAAAAAGGT GCATTATCTT CATTAAGTTC 16 320 

ATTGCTGTAA AGATGGTATT TCAAATACAT TCAGTATCGT 16380 

AACCAGAAGA TCAAAACCGT AACTTAACTA GTATGTTAGA 16440 

GTCACCACTT AAATATTAAC GTATTTAACC GTGAAACATT 16 500 

CAGAAGAATA TCCACAGTTA ACAATCCGTG TAT CTGGTT A 16 560 

TAACACGTGA ACAACAATTA GATGTAATTT CT CGTACATT 16620 

ATTTAAGGTG GGAG CACTAT GCTTAAGGGA CACTTACATT 166 8 0 

GTCGATGGAC CGGGATTAAG ATATATATTA TTTACACAAG 16740 

TATTGCCACA ATCCAGATAC TTGGAAAATT AGTGAGCCAT 168 00 

GAAATGGTGA ATGAAATATT ACCATACAAA CCATACTTTG 16860 

ACAGT CAGTG GTGGCGAACC ATTGTTACAA ATGCCATTCT 16920 

TTAAAAGAAA ATGGTGTGCA CACTTGCTTA GACACATCGG 16 980 

AAAGCATTTC AAAGGCATTT TGAAGAATTA CAAAAACATA 17040 

ATAAAACATA TTGATAATGA CAAACATATT AGATTGACAG 17100 
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TATGGATTCG ACATGTCCTT GTGCCTGGTT ATTCTGATGA TAAAGACGAT TTAATTAAAC 17220 

TAGGGGAATT TATTAATTCT CTTGATAACG TCGAAAAGTT TGAAATTCTG C CATAT CAT C 17280 

AGTTAGGTGT TCATAAGTGG AAAACATTGG GCATTGCATA TGAATTAGAA GATGTCGAAG 17340 

CGCCCGATGA TGAAGCTGTT AAAGCAGCCT ACCGTTATGT TAACTTCAAA GGGAAAATTC 174 00 

C CG TTGAATT ATAAATACAA TTCAGACCGA AAAGAAAGCA TATGCAACTT CAAGAGTGAA 17460 

GGGG CATATG CTTCTTTTTC AATTGAGTAT TGAGTATTAG CAAGACGTAG TAAGTATATG 17 52 0 

AGACAACTTC TACAATGGTT GAAGGAAGAC GTTTTTGTAA GTAGCTATGC TGATAAAGAA 17 5 80 

TGTGATGTCT TGTTAAAGGT GGGGTTCCAA TATCATCATT TAGCTGATGT TGAATGGGTT 17640 

ATTATTTGCT ACTTG CATAT GAATATGAGT CTTTTCAAAT TTTTATTGAC CCTGAGTAAT 177 0 0 

GAAAAATATT AAGATGAAAC TTAATATTAA AgCAATGCGG AGCGTGATTA TGAAGAGAAT 177 60 

TAGTAAAGAT ATATGGGCAG TATTTAAATT ACTGTATCaA AATAAAGGGC GTTTTAGCAT 17 820 

TAATGCCTTA CTATTGCAGT TAATCATGAT TTTTATTAGT AGTACATACT TAATTTTACT 178 80 

ATTTAATATG ATGTTAAAAG TAGCTGGcAA AG CCAACTTA CGATTAACAA TTGGACGGAA 1794 0 

ATCGTTAGTC ATCCCGCCAG TGTGATACTT CTTATTATAT TCATATTAAG TGTTGCCTTT 18000 

CTGATTTATG TAGAGTTTTC ATTGTTAGTT TATATGGTTT ATGCCGGCTT TGATCGACAG 18060 

ATTATTACAT TTAAATCCAT TTTTAAAAAT GCCTTTGTAA ATGTGCGTAA ACTCATAGGT 18120 

GTACCAGTTA TTTTCTTTGT CATTTATTTA ATGTTAATGA TACCCATTGC CAACCTAGGA 18180 

CTAAGTTCAG TATTAACAAA AAATATTTAC ATACCTAAAT TTTTAACGGA AGAACTTATG 1B24 0 

AAAACGACGA AAGGTATAAT CATTTACGGT ACCTTTATGA TTGCTGTATT TATATTAAAT 183 00 

TTTAAATTAA TATTTACTCT ACCGTTAACG ATTTTAAACC GCCAGTCGTT ATTTAAAAAT 18360 

ATGAGACTAA GTTGGCAAAT TACGAAGCGA AATAAGTTTC GGCTTGTTAT AGAAATAGTT 18420 

ATATTAGAAC TCATCATTGG TGCGATTTTA ACATTAATTA TTTCAGGAGC AACATATCTT 18480 

GCTATTTGTG TAGATGAAGA AGGAGATAAG T T TTTAG TCT CATCAATTTT ATTTGTTGTA 18540 

TTGAAAAGCG CATTGTTCTT CTATTATkTA TTtACGAAAT TATCATTAAT CAGTGTGTTA 1860 0 

GTACTGCACT TAA 18613 
(2) INFORMATION FOR SEQ ID NO: 113: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1214 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 113: 

AAAGTTTTAA AAGGGGTGAG ATACTTGGCG AATAATCCAT TCCAGCTTTG CGTTTAAAAG 60 

5 GAATTATACT TGCCATTGTC GGTGCTTGTT TATGGGGATT AGGTGGTACT GTTTCTGATT 120 

TCTTGTTCAA ATATAAGAAT ATTAATGTCG ATTGGTACGT CACTGCTCGA CTTGTAGTCA 180 

GTGGTGTTTT CTTACTTATT ATGTACAAAA TGATGCAACC CAAACGTTCA ATATTTAGCG 24 0 

10 

TATTCCAAGA TCGACGTATG TTAGG CAAAT TACTTATCTT CAG TAT AC TG GGCATGTTAG 3 00 

TAGTACAATA TGCTTATATG GCATCTATTA ATACAGGTAA TGCTGCGATT G CAACATTAC 3 60 

TACAATACAT TGCGCCAGTT TATATTATTA TTTGGTTTGT CATAAGAGGC GTTGCAAAAC 420 

is 

TAACATTATT TGATGTGCTT GCTATTATCA TGACACTATT AGGAACATTT TTATTATTAA 4 80 

CAAATGGTTC ATTTTCTAAT TTAGTCGTCA ATCCTGCAAG TTTATTCTGG GGTATTTTAG 54 0 

20 CTGGTGTAGC ACTCGCTTTT TACACAATTT ATC CTTCAGA CCTACTTAAC CGCTTCGGTT 6 00 

CGATTCTAAT TGTCGGGTGG GCAATGCTTA TTTCTGGTGT TGCGATGAAT TTACGCCATC 660 

CAATTTGGCA CATTGATATC ACTAAATGGG ACATATCAAT TATATTATTT TTAATCTTTG 720 

25 GTATTATCGG TGGTACCGCA CTCGCATTTT ATTTCTTTAT CGACAGTTTA CAATACATAT 780 

CAGCGAAAGA AACAACATTA TTCGGAACTG TTGAACCTGT CGTAGCCGTT ATCGCAAGCA 84 0 

GTCTATGGTT ACATGTGGCA TTCAAACCAT TTCAAATCGT AGGCATCATT CTTATTATGA 900 

30 TTTTAATTTT ATTACTATCA CTTAAAAGAC AACCTGAAAC ATTAGATGAA TAAGAAAACT 96 0 

CTGATAATCA CTTTAGCAAG TAACTATTAT TTAACAACGT AGTTACCTTA TAGGTGATAT 1020 

CAGAGTTTTT TATTTTAGTT AATAATATTT TTCACTTGGT ATAAAAAaGC GTCGTCGCTC 10 80 

35 

TGGTAATCGG AAATACTGGA ATAAAATATG GAATTGGGTA ATAATCCCAG GTAnTAAAAG 114 0 

TCCATGTTCC GATAnCCTnT CCGCAnCTCC AACCAAATTT GCCGATAAGG TTCCAAAAGG 12 00 

CATCCTGGGG GTAC 1214 

40 

(2) INFORMATION FOR SEQ ID NO: 114: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9458 base pairs 
45 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 114: 

ATTTTGGTTT CATTCACGAT GGGGTnATAC AGCAAACACA nCTAAAATAA CTATCAATAG 60 

55 
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CTTAGACAAT AAAAAATATG CCACTACAAT CGCTAATATT ACGATTAAAA AAGAAGCGTT 18 0 

AACGATTACT TTCATCGTTG TTCTATCTCT GAACATCATA TTAAAGACAA CTAGACTAAT 24 0 

5 TGATAATGAA ACAGCAAAAA AAGTAATAGC TAACACTAAT TTCATCATAA ATAGACAGAC 300 

TAAACCTATG ACTAATAATG TATTAGAAAT TACAGCTGAC GTTTTTAACA TTCTCGaATT 360 

AATATGCAC T CACCCTTTTT ATTTAAATAA CTTACATAAT CATAATAATA CATGATGTTT 420 

w 

CATAGGCCTG TCGATGATTG ATTCACAATA GCACGTGATT TTTTTGTTTT TCAATATTAT 4 80 

TCATTTATTC CATCAAAAAC ACCCTTTTTA ATTTTTACAA AAATTAAAAA AAGTGCTCCT 54 0 

ACACTGCTTG CATGTAGAAA CACTTTTTCA TTGTAATGTT ATTCTTCTCG AGACATACCT 600 

(5 

TTTAGCATAT TAAGCATGTA TGTTAAACTA CGGTTCATGT CGTCATCTTT CAATACGCCC 660 

AATAGACTTC TTATAGTTGT CTTAGCATTT GGACTCGCTT GATTGGCAAC GTGTAATCCT 720 

20 TTATTAACTT TATTTAGGAA GTCGCTTAAA TCTGATACAT TGAGTTCACC TAATAAAAAT 780 

ACCATTGAAG C CAT ATT AG A TAATAGCCCT GTATAAATAT CTTTATTAAG TTCAACTGCA 84 0 

AATTTATTTA TGATGACTTG ACGTCCTCGA ATTGCACCAT TTAAAGCATC TAATAGTTTT 900 

25 GCATCATCTA ATGTTTTAAT AAGCTTGATT GCTTTTAATA TACTATCTTT ATTCGCTGCA 960 

ATTGCCTCTG TAACTTCATT TAAACTTTCT AACTTAATTT GTTCTTCTGA TTTTTCTAAG 102 0 

CGTCTAATTT TAGAAGATAT TCTCTCAGCC ATTATTTATC CACCTGATTT CCCGGGAAAA 108 0 

30 

CATAAT CTGA ACGTTCCCAT TTTTTCTGTA CTTGAACACT GTACTGCGGT TGACGTTTTT 114 0 

TATTGACACG GAAATTATTA GGGTTCAACG GTGACTTACC ACGTTTCGTA ATTACCTCCA 12 0 0 

AACGACAGCT AGTACGTTTA TAAGATGGTG TATCCGTGTA TTGATCAACA TCACTaTTAG 1260 

35 

TTAATAAGTT AATTG CACCT AGATCTCCAT TTTCCATCGC aTCaTTATTT AATGGAATAT 132 0 

AGATTTCTTT ACCTTTAACA CGATCTGTCA CGTGAACTTG TAATACCGCT TCTCCTGTyT 13 80 

40 CAGAAATCAG CTTAACTTCT GCACCTTCAT GAATGCCTCT ATCTTCAGCA AGCTCTGGAG 14 4 0 

AAATTTCAAC AAATGCACGT GGCACTTTGT ATTTAATCAT TGGTGTTTGA TAAGTCATAT 1500 

TACCTTCATG GAAGTGCTCT AACAATCGAC CATTGTTTAC ATGAATATCA TAAATTTCAT 1560 

45 CTTGCTTAAA GTAATTATCA AATGATAATG GGAATAATTT TGCTTTACCA TTATCAAAAT 1620 

TGAATCCTTC TAAGTATAGA ATAGGCTCAT CAGTACCATC AGGTTGTACT GGCCATTGTA 1680 

AACTATTGAA TCCTTCTAAA CGATCATAAC TTACCCCAGC ATATAGAGGT GTTAAGCGTG 17 4 0 

50 CTACTTCATC CATAATTTCA CTAGGATGCT TGTAATTCCA ATCAAATCCT AATCTATTAG 18 00 

CAATTGCTTG GAAAATTTTC CAGTCAGGTT TTkAATCACC AAGAGGTTCT AATGCTTGGT 18 6 0 
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TTGCTGGCAA TACAACATCT GCGTATGTTG 
CCATGAAATC TAATTTTTCA AACGCAG CTT 
5 CCGTATCTTC ACCATATAAG TACAATGAGT 

TTTCATGATT ATCTTTACCA GCTTTTGGAT 
TAGCGCGAAT ATCATCCGCT TCAATACTTT 

to 

CCATATCACT ACATCCTTGA ACATTATTAT 
GACGACGATA ATTACCTGTT ACTAATAATA 

J5 CAATGTCTTG TTGTGTAATA CCCATTGCCC 

ATTCTTCAGC AAATTTAATC AATTCTGATT 
CCATTGTAAA TGTTTCTAAT GATTTGTAAT 

20 TAAATGCTTT ATCGTGTAAA TCATGATCAA 

CTAAATCCGT ACCTGGTTTA GGTTGATAAA 
TTCTAATATC AAATACATGT ATTTTTTGAC 

25 ATGCGATAAC TGGATGAGCT TCGGCTGTAT 

TTTCTAAATC TTCAATACTA CCTGAGTCAC 
TTGTTGCAGG TGCTTGGCAA TATCTTGAAC 

30 

GTCTTGCTAA TTTTTGCATT AAATACGATT 
ATGATAGTGC ATCTGGGCCA TGCTTTTCTT 
TTAAAGCTTC ATCCCATTCT ACTTCATGGA 

35 

TTAATCGTTG ATCTGAATTA ATATGTCCCC 
TTTTATTTGC TGGAGAATCA TGTGATGGTT 

40 AAACTTCAAA TGAACAACCC ACACCACAAT 

GCTCTTTACG CATTTCTGCT TCTGAATCTG 
CTGCTTTTTT AGTTAAATCA ATCATTGCTG 

45 AACCCGCATT ACCTTCCATA TTCACTTCCA 
ATTGACCACA AGATACACAT GAAGACTCAT 
GTGGATGTTC ACGATCCCAA TCAATTCTAA 

SO 

CTTCTACACA ACGCCCACAT AAGATACATT 
AATCTTTTTC GTATGGCTTC TCTTTATATT 

ss 



CTGTGAATGT TAAAAATTCA TCTTGGACTA 198 0 

GTACAAAATT AATATTTGAA TCCACAATAC 204 0 

GTACTTCTCC GTCATGTATA CCTTCTACCA 2100 

TCAATTTAAC GCCATATTCT TTTTCAAATT 2160 

GATAA CCAGT AATCTTATCA GGCATACTTC 2220 

GTCCACGTAA TGGATACGCA CCAGTACCAG 22 80 

AGTTTGAAAT CGCTGTACTT GAGTCACTAC 234 0 

AACAAATTAC AACAGATTCA GCTTTAGCAC 24 00 

CAGGAATACC TGTTGCTTCT TCAGCAAAAG 24 60 

ATTCATCAAA ATCATCTACC CACTCATCAA 2520 

TAATATACTT AGTCACTGCA CTTAACCACG 2580 

AACGATCCGC ACGTTCTGCC ATTT CATGTT 264 0 

CAAATAATTT TTGTGCACGT TTCATGCGTG 27 00 

TAGTACCTAT CAATACAGAC ATTGCCGCTT 2760 

CGCCGTGTCC AACCGTTCTA AATAAGCCTT 2820 

AGTTATCAAC GTTATTTGTG CCAATAACTT 2880 

CTTCATTCGT CGCTTTAGAA GAAGAAATGA 294 0 

TAATAGCTGT AAAATTATCT GCAATGACGT 30 00 

ACTCACCATT TTTCCTTACT AGTGGTTTAG 3060 

ATGAAAACTT ACCTTTAACA CAAGTCGCAA 312 0 

GTACTTTTAA AATTTCTCTA TCTTTAGTCC 3180 

AAGTACACAC TGTTTTAGTT TTCTTAATAC 324 0 

AGATTGCAAA TAGTGGACCA TAACCAGGTT 3300 

CTAATGAACC AGGTTCCGTA TCAGTCATAT 3360 

TCATGGCATT ACATGGACAT ACCGTCGCAC 3420 

TAATCGGTAC ATCATTATC C CAAATAACAC 34 8 0 

TAGTTTCATT CACTTCGATA TCTTGACATG 354 0 

GATTTGGATC ATAACGATAA AATGGGCCGT 3 60 0 

CATACGTTTG ATGCTGAAGC CCCCATGCAT 3660 
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TATGCTTTTC TAAAATTCGA TCAAGCGCTT CTTTTTGAGC ATCTTTCACA TCATTGTTCA 37 80 

CAGTATTTAC AGTCATTGGA CGATCAATCA CCGTACTACA TGAACGTTCA ATTTTACCGT 3 84 0 

5 CAATCTCAAC AGTACATGTA TCACATGTTT GAATTGGTCC CATCGACTCG TTATAACAAA 3 90 0 

TTGAAGGTAC AAAAG TATCT TGTGATTTAA TAAATTCAAG TAAATTCGTA CCTGGTTCTA 3 960 

CAAGATAATC TTTTCCATCA AGTGTAACCA CCAAATGTTC TTGCATATTA CTCACCCCGT 4 02 0 

10 

CTATATATAT TTTCCGTAAA TGACTTTTAA TAAATTGCTC ATATCCACCT AAAATAACGA 4 08 0 

TGCCCCACAC ATCTTTCAGA TAGAATTAAT TTAATTGTAT TACTTTATGT ACTAGTTGTT 414 0 

1S AAGTAAAATT TTGTATTTTG CCTTTTTACA ATCATTTTTA TTTGAAATAT TTTGCGCGAA 42 00 

ATTAAATCAT CTTTTTGTTT AATTGAAAAT AATTATCATT ATTAGTTTTC CAATTATCTG 4260 

TTTCACGCTT TTTG CCATAT CTTTCACAAC CTTATTAATG ACAATATTTA ATAATCACCT 432 0 

20 CACCTAAAAA TCGTTATACT ATTTATAAAT ACCCTTTTTC TGAAAATTAA TAACCCAAGT 43 8 0 

TTGATAAATA TCTACTATCA TTTAGAAGGT AATATTTATC TTTAAATTAA ATTTGTAATG 44 4 0 

GATTAATTTA TAAAAATCAA ATCAGGCATT AAATAAAATA GCCCATAAAT ACAAAGTGTT 450 0 

25 ATCACCTTCT ATTTACGGGC TATTAGTTCT ATTCGTTATT CTATTTACAG ATCATTCTAT 4 560 

CTAATTAATT TGTGTACAAT TTTGATAACT TATTTTCCCT TAGTTTACTA CTCTAGATTA 4620 

TCTTTTAATA ACTTAGTACT TTCAGCTTTT GACTGCTCAC TAGGAATGAA GTAGTACAAT 46 8 0 

30 

CCGTCACTTT GAATGCCGCC TTGAC CACTC AATTGATGTT TATTAATCGT GTCATTAGCA 474 0 

TCTTTATAAT TGCTTCTAAT CGTATTCAAA TCACCTAATG TTAAATCTGT TTTAACATTA 4 80 0 

TTTTGAATTT CATTCATTAG ACTATTAAAA TGTGTAATCG ATGATGGGCT TGCAATCTTA 4 860 

35 

TTGGCCATCG CTTCAAGCAC AATTTGCTGA CGTTGTTGTC GACCAAAGTC ACCACCAGCA 4 92 0 

CCTTCTTCTT TACGACTTCT AATAAACTTC AATGCTTGAT CACCATTTAC ATGTGTCTGC 498 0 

40 TGTCCTTTTG TAAAACGAAC ACCATCAACA GTGAATGTAT CATTACTTAC TACATCAACA 504 0 

CCGCCGATGC TATCTATCAT ATTATGCAAA CCATCCATAT CGATTGTCGC ATAATGAT CA 510 0 

ATTGGCACAT TCATTAATTT TTCAAGTGAT TTAACAGCCA TATTTGGTCC ACCATATGCA 5160 

45 TAGGCATGTG CAATTTTTTC AGTAGTACCA CGGCCAACAA TTTCCGCTCT TGTATCACGC 5220 

GGTATACTTA CTATTTCAGT TTTCTTCGTT TTAGGGTTGA TAGATAAAAT CATAATACTA 528 0 

tCACTACGCT CTCCGCCACC C TTT TTCTTA CGATCAGCAT CTGAATCGAC ACCAAATAAA 534 0 

50 GCGATTGTGA ATGGATCACC ATCGTTTAAA CTCACTTTTT TATCTCTTAA TTCTGAATGA 54 00 

TTGCGATCTA ACGGATTGTG TATCTTATTA CCAGTAATAA AAATTTTAGC AGCTACATAC 5460 
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GGTAGGCTCA TTTTACTTTT AGACGAACGT TTCAATCCCA CCACTCCTTT ACTATTCCTT 5 58 0 

ACATACTTTG TCTGTTTTCT CTATTTATTA TATAGTAAAA TAATTTTTTT ACTATACTTC 5 64 0 

5 TGTAGACGTA TAACTATTTT TTATCATTTT TTATCTCTAG AGAATATCTA TCTGTATTTT 57 0 0 

TGATAACCAC CATTTGCATT TAAAATTTTA AGTACCGTTT CATGACATGC TTTATTACTT 5 76 0 

ATAATAAAAG GTGCACCCTT TAAATGATCA ATTGCCTTAC CATCTAAAGT CGTCATTTTT 5 82 0 

AGATTCAATA GTTCTGCAAA TAAAAACTGT GCAGCAATGT CCCAAGGTTT AGGATTTGTA 5880 

TTAATATGTG CCCCAAATTG ACCTTTTGCC ACTCGCATAG AATCTAATCC GCAAG CAC CA 594 0 

ACTAAACGAT AACTAAATGA GGCGTCAAAT AAATCTTGCA CCGTATCTAG ATTCATCACT 60 00 

15 

TGTG CATTAA ACGATATAAT AGCGTCTTCC AATTTTAACG ATGGTGGTTC TTCCATCTTA 606 0 

ATTCCATTAC AAAAAGCACC TTCTCCTCGT ATTGCTTTAT AAAGCTTTTT ATGCGGATAA 612 0 

20 TCATATACGT ACGATAACAT TGGTTTACCT TCATAAAAAT ACGCCAATAT AATACAATAA 6180 

TCTTCTTGCT GTTTTACTAA ATTGGCAGTT CCATCAATGG GATC CATAAT CCATAAATGA 624 0 

TTAATTTCAT TCGTAATCAT TTCATTACTT TTTT CTTCCG CTAATAGTTG GTGTTCCGGA 63 00 

25 AAATGTGTTG CTAAAAATTG TTGGAATTGT TGTTGAATCT GTTTATCTAC ATTTGTAACT 6360 

AAATCAAATC GATGACGCTT AGTTTCTGTA GTCATTTCCA TAATTAATTG CGGAATAACA 6420 

TTGTCTATTT GTTTCAACCA CGAACATATT AACTTATCTA TTTG CTGTAA TGTTTTATCT 64 8 0 

30 GTCATTTCGT CCACCACTTC TCATATCATT ATCATTTTAT TATTACCCTA TATTAAAAGA 6 54 0 

ATCAACAATA CAACTGAAGA CTTCTTCATT TTATGCATAA AAAAATCGGC TAGTCACGTG 6 60 0 

CTAGCCGACA AATAGAAAGG AAAGTAAGTA ATAAATATTG AAGATGTTGT GATGTAACTT 6660 

35 

GAACGATTAA AAGCTATCTG TTATATAGCT CTACCCCTTT GTTTAATCGC TCCCCCTGTT 67 2 0 

ACAAGTAATA TCATAGCACA ATC TTT TTTA AAATGTAAGC GTTTTCCACA AAATTTTTAC 67 BO 

GATTTTTTTA AAAAGATATT GAAAATGTCC TCATTGTCAC TCTTATGTTA TACTTTGTGT 6 84 0 

40 

AATATATCAT CTTTTAGGAG GTGGCTGTCA TGAATAAAG C TGAAAGGCAA AATTTAATAA 6900 

TTACTGCAAT TCAACAAAAT AAAAAAATGA CCGCTTTAGA ATTAGCTAAA TATTGCAACG 6 960 

45 TATC CAAACG CACAATTTTA AGAGATATTG ATGATTTAGA AAATCAAGGT GTTAAAATTT 7020 

ATGCGCATTA TGGGAAAAAT GGTGGTTACC AAATACAACA AGCACAATCT AAAATTGCAT 7 0 80 

TAAACTTATC TGAAACACAA TTATCAGCCT TATTTTTAGT GCTTAATGAA AGTCAGTCGT 714 0 

50 ACTCGACATT AC CATATAAA AGCGAAATCA ACGCAATTAT AAAACAATGT TTAAGTCTTC 72 0 0 

CACAAACACG CTTAAGAAAA TTGCTTAAAC GCATGGACTT TTATATTAAA TTTGATGACA 72 6 0 

55 
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ATGTGATGTT AGTAGATCAT AGGGTTGATG ATAATATTAA AG CTG AAAAC GTTATATTTA 73 8 0 

TTGGCCTTTT GTGTAAACAT GGACATTGGC ATGCAGTCAT TTATGACATT GCTCAAGACA 74 4 0 

AAACTGC CG A ACTCGAAATT GAAAATATTA TAGATATTTC GTATTCATTC GGTAAGACGA 750 0 

TTCAAACCAG AGACATATCC ATTGATAACT ATCATCAATT TTTAAACCCC ATCGATTCCT 7 56 0 

AAAAAACAGC AGTAAGATGA TTTTCAATTA GAAAATATCT TGCTGCTGTT CTCTATTTAT 762 0 

ACAATACTTC GTATTGAATG GnTTCGCTTT CCTAGGGTGC CGTCTCAGCC TTGGTCTTCG 76 8 0 

ACTGGCACTG CTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACAT GTAATTTTAC 774 0 

TTTGAAATAC TTAAAAAAAT AAAACACTTT GCCCAACTTA CACTACCAAT AGAAACTGCT 7800 

GTTAGAATTC CTCAAAATGA TATTTCGCGA TATGTTAATG AAATTGTTAA AAAGATAGCT 786 0 

GATAGCGAAT TCGATGAATT CAGACAT CAT CGTGGCGCAA CAT CCTAT CA TCTAAAAATG 7 920 

ATGTTAAAAA TCACCTCATA TTCATATACT CAATCTGAAT TTTCTGGCCG TAGAATAGAA 7 980 

AAATTACTTC ATAACAGTAT TCGAATGATG TGGTTAGCTC AAGATCAAAC ACCTTCTTAT 804 0 

AAAACTATTA ATCTTTTTAG AGTGAATCCT AATACTGATG CGCTAATTGA ATCTTTATTT 8100 

ATTCAGTTTC ATAATAAAAT GCATAT CAAA AAAGCTGATT TCTATCAAAT AATTAATAGA 8160 

AATCAGCTTT TTTCaTTGCC TAAAAACTTA ATGTCCCGAC CTCTTTATCT ACGCATAAAT 822 0 

ACTTATTACT GATATAACGA AAG AAA CAAA ATTATTTGCT ATATGTAATG CAATTGTTGA 828 0 

ACCTAGGTTT CTTCCAGATT TTAAATAAGT GAAAACTAAT ATGATGGATA GTATGAGATA 8340 

TGGACCAAAC TCAAACGGCG ACTTTGCATC AGTCACATGA ATAAATG CAA ATAAGAACAC 8400 

CGAAACAATA CTCATAGCTA TAAAATTAAA CTTCTTACCT AATTCTCCAA TTAAAATATG 84 60 

TCTAAATACG ATTTCTTCAA CTATTGGACC TACAATCACA ATTAATAAGA ATGCTACAGG 852 0 

TAAAAATGCA GGCACTTCAA ACATTTTATT TAGCTCAAGT TCATTGGCTG TTt CACTATA 85 80 

TTGCAAATGT TTAGGTAGAA ACTGTGTCAT ATATTCATAT GTATAAATTA AGATGAGAGC 864 0 

AATAATATAC GTTATTGACA ATCTAAGCCA ATATTTTTTG ATATACGCAA AACCAGCTCG 870 0 

AAGCCTTGAT GGCATCACTT TTAAATGAAA TAAATAAAAT GCGCCAATCC CAATCGTATA 8760 

TGCTAAAGCT TGTGTGATAG TCGCTACAAA TATCAGATTA CTATCGATTT CATAATAACC 8 820 

AAACAAAATT GGTCCTATGT AAGCTGCAAT TGTGAGTG CA TAAAATATAA CACCTATAAT 88 80 

TGGAATTATA AG CAAATCTC TCCATGCTAT ATCTTTAAAC GTGTATTTCT TTTTTTCATT 894 0 

TTCCaCTGTT ATATCCtTTC CTGTTTAATA ATTGATTTTT GGAGGTACTT CTACATGATA 9000 

AACGAAACTA AGTATATGAG ACAACAAATT ACTAATTTGA TTCAAATCAT TGATACGATT 9060 
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ATAGTTACTA ATGAATTGAA TAAGTTCAAA GGCTTTGAAA CATCATATAT AATAAACGAA 9180 

AATCAAGTTT C C T ATTATG A AATTATAACA CTACTTAATA AACGTCCCCT CgACAAGTCG 924 0 

ACTATGGTAA CAAAATTCAA TATCTTAATT TTTATCATAC AGAACTATCT AACGCATTAT 930 0 

TTGCAATTAA ATTTGCCCAT TAACCTATTT TT CATAAAAT GTCATTTAAA CAAG T TATTT 93 6 0 

ATTAAAATTC ACTTTATTAC ATAAATTATA CAATTArAAA GTTTCTTCAA ATTGTAAAGA 94 2 0 

TGCATTAATC GAGTTATAAT CATAATGATT AAGATGGT 94 58 
(2) INFORMATION FOR SEQ ID NO: 115: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 910 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 115: 

AnGCGTATCA TGTCACGCAT TTTAACTACT TCTTTAC CAC AAGATTATA C AGTCACATTA 60 

GTTGATCGTA TGCCATTTCA TGGATTGAAA CCAGAATTTT ATGCTTTAGC TGCGGGCACG 12 0 

AAATCAGATA AAGATGTTCG TATGAAATTC CCTAATCATC CACAAGTGAA TACAGTTTAT 180 

GGTGAAATTA ACGACATAGA TTTAGATGCT CAAATTGTCT CAGTCGGTAA TTCTAAAATT 24 0 

GATTATGATG AGCTAATCAT TGGTTTAGGA TGTGAAGATA AATATCATAA CGTTCCAGGA 300 

GCCGAAGAAT ATACACATAG TATTCAAACA CTCTCAAAGG CTCGGGATAC TTTCCATAGT 3 60 

ATTAGTGAAC TACCAGAAGG TGCTAAAGTC GGTATCG TTG GTGCTGGATT AAGCGGCATA 4 20 

GAACTTGCCA GCGAATTAAG AGAAAGTAGA TCAGACTTGG AAATATATCT TTATGACCGT 4 80 

GGGCCGCGAA TTTTAAGAAA TTTTCCAGAA AAATTAAGTA AGTATGTTGC GAAATGGTTC 54 0 

GCCAAAAATA ATGTTACCGT TGTTCCAAAT T CAAAT ATT A ATAAAGTTGA ACCTGGTAAA 600 

ATATATAACT GTGATGAACC TAAAGATATT GATTTAGTTG TATGGACAGC AGGAATTCAA 660 

CCTGTTGAAG TTGTTCGTAA CTTGC CGATT GATATAAATA GTAATGGACG CGTGATAGTT 720 

AACCAGTATC ATCAAGTACC AACATATCGT AACGTCTATG TAGTTGGTGA TTGTGCTGAT 7 80 

TTACCACATG CGCCAAGTGC TCAGTTAGCC GAAGTTCAAG GTGATCAAAT TGC CGATGTG 84 0 

CTTAAAAAGC AATGGCTAAA TGAACCATTA CCTGACAAAA TGCCGGAACT AAAGGTACAA 900 

GGTATCGTTG 910 
(2) INFORMATION FOR SEQ ID NO: 116: 
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(A) LENGTH .- 10162 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi! SEQUENCE DESCRIPTION: SEQ ID NO: 116: 





TTTTTGATTC 


AAAGTGGTGA 


TTTAACAAGC 


ATTTTAAATA 


GCAATGATTT 


GAAAGTCACA 


60 




CATGATCCTA 


CCACTGATTA 


TTATAATTTA 


TCTGGTAAGT 


TGTCGAACGA 


TAATCCAAAC 


120 




GTTAAACAAT 


TAAAACGTAG 


ATATAATATT 


CCTAAAAACG 


CATCAACAAA 


GGTGGAATTA 


180 


rs 


AAGGGAATGA 


GTGATTTAAA 


AGGCAATAAT 


CATCAAGATC 


AGAAACTTTA 


TTTTTATTTT 


240 




TCAAGTCCTG 


GAAAAGACCA 


AATCATTTAT 


AAAGAAAGCC 


TTACTTATAA 


TAAAATAAGT 


300 


20 


GAACATTAAT 


ACTTATGCTG 


TAATTATAGA 


AACATCCAAA 


TCATCTATTA 


nAATCCTATA 


360 


TTATAAAAnC 


ACCTCACATA 


ACTCGTTCAA 


CTGTACCAAA 


CCACATTACA 


TTAGATTTTA 


420 




GGCTAACTAT 


TGTGATGTAC 


ATCAAAAACG 


AATTTGTGAG 


GCG TTGTATA 


TTTTACAAAG 


480 




GTGACTAGCG 


TTTCGTATAG 


CATTTCCAAC 


ATTACTACAC 


TCAAGCGTCA 


CGCTAAAGTT 


540 




CGAAATCGAA 


TCCTTTCATT 


CAACAAAAGC 


T CAT ATC CA C 


TACAAACTTC 


ATATCAAGCG 


600 




TATAAACTAT 


CTTGTGATAC 


TATCTCGATC 


ATATCTATAG 


TATGCATTTG 


TGTTCCGTTT 


660 


30 


CACTGAAGTA 


TATGTATCAT 


CAGTTAAGTA 


TAAACCGTCA 


TCCTTCAATG 


TTACTTGATA 


720 




AGCATATTTC 


CGTGCTAACC 


AGGCAATATC 


TATATAATTT 


TCTCCTGCGT 


TTTCATAACT 


780 




TCTTAAATCT 


TCAATATGTG 


CACTAACTTC 


AGGGaAAATG 


ATTCTAACAA 


CACTTTCATC 


840 


35 


AACCCAATAT 


TTGTCATGCA 


TCCATCGCAC 


TTGATCTGCC 


AATAAAGGTA 


ACTGCACATC 


900 




ATTGAAATAT 


AGACGAAAGC 


CGTCACTATC 


ATACATTTGC 


CGATATGGTA 


ATGGCTGTTT 


960 




TCTAATCACT AACACCTCGC CACCCATTAC GGTGCCTTCT CTAGTAT CAT 


CACTTCCACC 


1020 




CGAAGCTTCA 


TACGTTGTTG 


GGTCAACCTG 


TAGTCCATGT 


ACATCTCCAA 


TAT AAG CATC 


1080 




TGGTTTATGT 


TCCATTGCAT 


GTCCATGTGC 


AATCAATGCT 


AATATTGTAG 


ATTGTGAAAA 


1140 


45 


TTGAGGCTCC 


CATTCAATGC 


GATTAGGATG 


GCTACTATAA 


ATTCTAGGTT 


CATCTATAGC 


1200 




CTGCTGAATA 


TCCATGCCAA 


ACACTAATAC 


ATTGATTAAT 


GTTTGCGCAA 


CACTAGCAAT 


1260 




GATACTTATG 


GCACCAGGTG 


CACCTACTGT 


TAATATTGGC 


TTCCCGTGAT 


ACATCACAAT 


1320 


50 


CGTTGGAGCC 


ATGTTACTTA 


GTGGTCGTTT 


ATATGGTGCA 


ATTTCGTTAA 


TACCACCATC 


1380 




TACTACATCA 


AAGCCATCCA 


TTGTCGTATT 


CAATAACACA 


CCGTAGCCTG 


GAATCGTGAT 


1440 




ACCTGAACCA 


TAAATCATAC 


CAATTGATGT 


CGTAAATGAA 


GCAATATTAC 


CTTCCTTATC 


1500 
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ATCAGACACA ACACCATGCT CTATATCAAT ATTTG CTTTA TTGCTATCAA TGAGCGTACT 162 0 

GCGTGCTTTT AAATAATCAT CATCAATTAA TGACTGTACA GGCACCTCAT GAAAATTATC 16 80 

AT CCGCCAAG TATTGCGCAC GATCACTATA TGCTAAATGC ATCGCTTGTA TCAAATGATG 174 0 

CAAGTAATCA ACAGATCTTG GACCCATAGA TGGTAAATCG ACATGTTCTA ATAACTTCAA 1800 

TATTTGAATT ACCGTGATAC CGC CAGAACT AGATGGTCCC ATTGaATAAA TGTCATAGTC 1860 

TTTAAATGTT GCACTGATTG GCGCTTTAAT CTGAATGTCA TATTTGGCTA GATCCTCTAA 192 0 

AGTGATTGTC CCACCACATG CTTTGACAAC ATTGACTAAT TGTTTCGCAA TGTCACCTTT 1980 

ATAAAATGCA TTAAACCCTT GTTCTCTTAA TATTTGAAAT GTCTTACCTA ATTCGGGTTG 2 04 0 

TACAATCCAA TCACCTTCAC G CCAATATTG ATTTTCATGC GTAAATACTT GTGCCGTTTC 210 0 

ATGATACTTT GTCAATCGTG CGTGTTGCTG GCGCGAATAT TTTTCAGTAG CCCAATTGGC 2160 

TGCATGACCT TCAATGGCTA GTTCAATTGC AGGATTAATT AAATCTTCCA ATGACAATTT 2220 

AGCATAACGC TTGTGAATAT AATCAAACAG CTTTGGAATT GCTGGCACAG CGACAGTTTT 2280 

ACCATGTGTA GTCATAT CAA AAAATGATTT ATATTCGCCT GAATCATCTA GATAAAATTG 2 34 0 

TTTGTCTACA TGTTCAGGTG CTGTCTCACG TGCATCAAAC GCAGTTATAC TGCCAGTACT 24 00 

TTGCTCATAA TATAG CAAAT ACCCGCCACC ACCAATACCT GATG CAAATG GTTCTACCAC 24 6 0 

ATTCAATGCC AGTTGAATTG CAATCACTGC ATCCATGGCG TTGCCACCTT GATCTAATAC 2 52 0 

ATCCTTACCA ATTTTAGCCG CAAGAGGATG TGATACGGAA ATTAACCCTT CTTTAGATGT 2580 

TTTTGTCTGT TTGTCATTTA AGTTAATGAC CATACTATAT CCTCCTACTT TCTGTTAAAT 264 0 

ATTTAAAACA TTATTGATTA ATGGCTTTTT CTACTTTTTC TAAATCTTGA CGTTGCTCGT 2 70 0 

TACCAGTATC GACAAGTGGT GTAAT CGGTG ATGCAATTTT AAATTTATCG C CACG AT AAA 27 6 0 

ACTTAATAAA TTGATCCTGA TCTATCGCAT TAACTACTGC TTGTCTCAAG TTTGGATGCG 2 82 0 

TCTTAAATAT ACCTTTTTTA ATATTTAGCA TTAAAAAGAC TGACTTGCGT CCATTTTTGC 2 880 

GAATAATGCT TAAATTTTTA TCCGACTTAA TTAAATCAAA ATGTTTTTGA TTCACATCTG 2 94 0 

CCAACATATC AATTGAATGA TTTCTAAGTT CTGACAATGC ATTATTCGGG TCACCATTAA 3 000 

ACTTCAATGT AATATTTTTA ATTTTAGCTG GTCCATAACT ACCTTTTTCT GTTTCGTTGA 3 06 0 

ATCCTGGATT ACGTTGAAAC GTTGCTTGAT ATGCATTTTT CTGTGTCATA ATGTATGCGC 312 0 

CACTTGCATA CAGCGCATTT TTCCCATCTG AATTTGCAGG AATTGTACTG CTATCCCCAT 3180 

ATCCTTTTGG ATATTCTTGA TTTACTTGAT TAACAAATTT TTTAGATAAA ATGCCTGCCG 3 24 0 

AAGAGTGTGT TAAGTAATTT ACCTCTCGAG GCATCGATTG ATCTGTCGTA ATTTTAACAA 3 3 00 
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TATAAGCTTT AATCAACTTA TCATAGATTG ATTTATCGTC CTTGTCTTTC TCTTTACGCA 34 20 

ACTGATCGAT GTCCTCATCT TTTAATATCT TGATGTCATT TATATGTTTG TGCATATTGT 34 80 

5 AAGTATTATT GTTAGGCACA GACTTTTTAT CACGTGCTCT ATCTAAAGAA AACTTAACAT 3 54 0 

CTTCAGCCGA TACACGCTCT CCAGTATTAC GTGCTTGTCC ATTGACCACT TTCGCAAAAT 3 6 00 

AATCATCATC TCTTAACAAG AAATAAAATG CTTTATTGTC CTTATTCACA GCATAATCAT 3 660 

10 

GACTTAACGA ACCTTTCGTT GTTAAATGAT CATTTTCATC TAATAATAAT AACCTTGTGT 3 72 0 

ACATATTCAT ATTAATTGAA TATACTGACG GCGCAATTGA ACGTATTGGA TCCAATGTAG 3 78 0 

GAATTTCACC ATCTTGTTGT GTCATCACAA GTGGCCGCGT ATCTCGTTCT CTA CTATTGT 3 84 0 

15 

TGTAATCAAA TTGTTGCCAT ATTAATG CAC GTGAATTTGG CAATCCAACA CTATTTTTAT 3 900 

CTAACACTTT ATTGTCATAT ACTAAATTCT TTTTTGATCC ATATAAAGGC GCCATATACC 3 960 

20 CTTTATCAAA TACAACTTCA T CTT CAATTT GCTTATATGT TTGTTTAACA TCTGCTTCAT 4 0 20 

TTTGAGTAGA AGCTTTATTT AACAACTGGT CTACATGTTT ATCTTTCAAT AAACTATTTG 4 080 

ATCCTGTAGA ACTAAATAAT GCCGTCATAG CATAGTTCGG GTCACCAAAC ACTGTCATCC 414 0 

25 AGTCATCAAT TTGGATATCA TAATTGCCGG CTTGACGTTG TGTACGATAG CTAC CATAAT 4200 

CTGGTTGGAT ATTCATCTTC ACGTTAAATC CTGCATTTTC CAATTGATCT TTAACGATAT 4 26 0 

TCATATCATT TTCATAACTT GCTTGTCCTA GGAAATGTAT TGTTGGTCGC TCGCCTTTCA 4 320 

30 

CTTCAACTTT CGATGACTTT TGAGCCACTT CTGATTTCGT AGGGACACCA CAACCACTTA 4 380 

ATACCAACGC TAAAACTATA ATTGCGATAC TAATGATTTT CTTCACATCT ATCCCTACCT 444 0 

TTTTAATGAA TTCTTGGATC TAGTG CAT CA CG CACTG CAT CAC CTATAAA ATTAAATGCT 4 50 0 

35 

AAAACGACGA ACATAATACA AACACCAGGT ACAATAGCTA AATTACTGTG CGTTTCCAAG 4 56 0 

TAGTTACTAC CGGTACGTAA AATGTTGCCC CATTCAGCTA CATCAGGTGC AACACCAAGT 4 620 

40 CCTAGGAAAC TTAAACTACT TGTT GTTAAT ACAACCACAC CTATATTTAA TGAAAAACGT 4 6 80 

ACAATCATAG GCGCAATCGC ATTCGGTAAA ATATAACGCC ATATGATATT CCAAGTGTTT 4 74 0 

TCACCAGTGA TACGTGCTGC ATCTACATAT TCCATGCGTT TAATTTCTAA AACACTGGCA 4 8 00 

45 CGCATTGTCC GTGCAAATGA TGGTATATTA CCGATACTTA AAGCAATAAT TAAATTTGGA 4 860 

ATACTTGCTC CAAATGATGC AATAATTGCC ACCGCTAACA ATAATGATGG AATTGCAAAC 4 920 

ACTACATCTA AAATTCGCAT TATTAAATTA TCAATATGAT TAAAATAACC TGCGATAGTG 4 930 

so 

C CTAGTAACA CACCAAAAAT AACTGCAATA ACTACTGAAA TAATTGAAAT TGAAAATGTC 504 0 

AGCTTCGTTC CTACAACTAC GCGTGTAAAT AAGTCTCTAC CGAAAT CATC AGTAC CAAAC 5100 
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GTATCAAATG TAAATTGTGA CACAATTGAT AATGTCAGCA TGTAGACTAA AATAAGTAAC 522 0 

CCGATAATCG CAATACGATG TCTAGTAGTT TTTCGTATAA ACGATTCCCA CCCGTTATAA 528 0 

5 CTATGTATTT GCGATGTACG TTGGTAACGT CTAATACTTA CAAACATTAA TAATGTAAAT 5 34 0 

ACGTTGCCTG TTAATGTCAT CAACAATAAC AACACTT CGA CGATACGTCG CCATAGGTCA 54 0 0 

TGATGCTTCC ATGTTTGTTC CGTTGTTAAA ATAATAATTA AAATGATGGT TAAAACGATT 54 6 0 

10 

AGCAATGTTT CAGCAATATA GAACGTATCG GCCACATAAC CTTTAAAAAG ATTTAATGCA 552 0 

CTCGTTAATA TAACTAAAAT ATAAGTTGCT ATGGCGTAAC TTG CGAATAA TTTTAAGGAA 558 0 

GCTATCTTTG AATTAAGTTG TGCCATATGC CTCACTTCCT TTCGTTGATT TCACTACGTA 5640 

15 

ATTTTGGATC GATTAAAGCA TAAAATATAT CAATAATTAA GTTTGCTAAA GATATTACAA 570 0 

TTGATATATA TACGACCCCA CCCATGACTG CTGGAATATC AGGTATTAGT TGTTTTTGGA 57 6 0 

20 CGATATAACG CCCGATACCA TTAATGTTAA ATACTTGTTC CGTCACTGCT GAACCGCCTA 5820 

GTAACTCTGC CACTAGAAGA CCAACTAACG TTACAATTGG AATAATGGCA TTTTTCAAAA 5880 

TATGTTTAAT AACAAC TTGT GTCGTCGATA ATCCTTTTGC ATAAGGAGTT AAAACATAAT 5 94 0 

25 CGctGCGCAT TACTTCAAGT ACAGAAGACC TTGTCATACG CGTGATAGAA G CAGCAATAC 6 000 

TTGTTCCAAT GACAAGTACA GGTAAAATCA ACGATATTGG ATGTTCTGGC ATATAAGATG 6 06 0 

GTGGCAAAAT ATCCAATTTC AATGAGAACG CTAAAATGAA TAATAGCCCT TGCCAGAAAC 6120 

30 

TTGGAATAGA TAAAC CAATT AATG CAATTA TCATTAACGT GATATCAAGC CAACTATTTC 618 0 

GCTTCATCGC ACTGATAATA CCAATTGGTA TTG CAATAAT TAATGCCACC ATTAGCGCTA 6 24 0 

ATACTG CG AC AATTATTGTA ATTGGAATTC TTTCGCCAAC TGCTTTAGTC ACAACCTCAT 6 300 

35 

TCCCTTTGTA AGTCGTACCT AAGTCAAAGG TAAAAACACC CTTGATGGTA TCCCACAATT 63 60 

GAATSAAATA AGGTTCGTTA AGATGATGTA ATACATTGAA TTGATGTATC TGTGCCTTTG 64 2 0 

40 TTGCATTTTG TCCCAGTATG CTATAAGCCG CATCAAGCGG TGAAAAATAC AGAATGGTAA 64 80 

ACACACTGAC AATAACAC CA ATGATGACAA TCACAGCCAT GACAATTCGT TCAAAAATAT 6 54 0 

ATCTAACTAA TGG CTGT AAA TAAAAAGTCA ATAAGATGAA CATCGGCAAG GCCAATATCA 66 00 

45 CTTTGATCAT GATGAACTTA TGAAATAATA CATTTTCAAA GTATGTTGAA AAATGTGCTT 6 6 60 

GTTCAATATT CTTTGAACTC GTATTAGAAC TTTGTGCCTT GAATATTTTT AATGCTTCTT 672 0 

TATGTATTTG TGTGGATGAC TTTTGCTGCG ATAAATATTT ATATTTTTGA TGTAACGCCT 6780 

50 

GTTCAATTTC TGAAATTTCA GAATTATTAG CGTAAAAATT TTTCCTCTTA GCAGAAAAGA 6 84 0 

AAAACTTTAT CACTGCATAT AAAAATATTG GCAAGCTTAA TACCGATAAT ACAAACTTGT 690 0 
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CTTG TAAAAT AATCTTGAGT 


AGATTACTAT 


GATATACAAA 


AGTATAGAAT 


AAATTTACAC 


7020 




ATTTGTGaAT AGGGAGGCAC 


AACATCATGT 


CAAATTTATT 


AGAAGTCAAC 


AGTCTGAATG 


70B0 




TACAATTCAA TTATGATGAA 


ACTACAGTTC 


AAGCGGTAAA 


AAACGTCTCT 


TTCGAATTAC 


7140 




GAAAAAAACA TATCCTAGGT 


ATTGTTGGTG 


AATCAGGATC 


AGGAAAAAGT 


ATTACCG CT A 


7200 




AATCTATTTT AGGGCTACTA 


CCAGATTATC 


CAGATCACAC 


ATTAACAGGA 


GAAATTATTT 


7260 


TTAATGGGCA AT CGTT AAAT 


AATTTATCAA 


CTTCAGCGTT 


ACAACAAATT 


CGAGGTAAGG 


7320 




ATATTTCAAT GATTTTTCAA 


GATCCACTCT 


CTTCGTTGAA 


TCCAAGATTA 


ACGATTGG CA 


73B0 


fS 


AACAAATTAC AGAAGTAATA 


TTTCAACATA AACGTGTATC 


TAAATCTGAA 


GCAAAGTCGA 


7440 




TGACAATAGA CATTTTAGAA AAAGTAGGTA TAAAACATGC AACTCGACAA TTTGATGCTT 


7500 




ATCCACATGA ACTTTCTGGT 


GGTATGCGTC AACGTGTCAT 


GAT AG CAATG 


GCATTGATTT 


7560 


?0 


TAAAGCCACA AATTTTAATC 


GCAGATGAaC 


CAACAACGGC 


ATTAGATGCC 


AGTACACAAA 


7620 




ATCAATTACT GCAGTTAATG 


AAGTCCCTTT 


ATGAGTACAC 


AGAAACATCT 


ATTATTTTTA 


7680 




TCACTCACGA TTTAGGCGCT 


GTGTATCAAT 


TTTGCGACGA 


TGTGATTGTA 


ATGAAAGATG 


7740 


25 


GAAGTGTCGT TGAAAGTGGC 


ACGGTTGAAA 


GTATTTTTAA 


ATCGCCACAA 


CATACCTATA 


7800 




CAAAACGCTT AATAGATGCG 


ATTCCTGATA 


TTCATCAAAC 


GCGTCCGCCA 


AGACCGTTAA 


7860 




ACAATGATAT TTTATTAAAA 


TTCGATCGCG TGAGyGgGAT TACACATCAC 


CGAGTGGCAG 


7920 


CCTATACCGA GCAGTTAATG 


ATATTAACTT 


GGCTATTAGA AAAGGCGAAA 


CATTAGGCAT 


7980 




TGTCGGTGAA TCAGGGTCAG 


GGAAATCGAC 


ATTAGCTAAG 


ACGGTCGTCG 


GTCTAAAGGA 


8040 


35 


AGTGTCAGAA GGCTTTATTT 


GGTATAACGA 


ATTACCATTA AGTTTATTTA 


AAGATGATGA 


8100 




ATTGAAATCT TTACGACAAG 


AGATACAAAT 


GATTTTTCAA 


GATCCATTCG 


CATCTATTAA 


8160 




TCCAAGATTT AAAGT CATTG ATGTGATTAA 


ACGAC CACTA 


ATCATTCATG 


GGAAAGTCAA 


8220 


40 


AGATAATGAT GACATTATTA 


AAACTGTCGT 


ATCGTTGTTA 


GAAAAGGTTG 


GCCTAGATCA 


8280 




AACTTTCTTA TATCGCTATC 


CACACGAATT 


ATCTGGTGGG 


CAACGTCAGC 


GTGTAAGTAT 


8340 




CGCGAGAGCA CTTGCTGTTG 


AACCTAAAGT 


GATTGTTTGC 


GACGAGGCAG 


TGTCCGCTTT 


8400 


45 


AGACGTTTCA ATTCAAAAAG 


ATATCATCGA 


GTTATTAAAA 


CAATTACAGT 


TAGACTTCGG 


8460 




CATCACTTAT TTATTCATCA 


CACATGACAT 


GGGTGTTATC 


AATGAAATAT 


GTGATCGCGT 


B520 


50 


TGCAGTTATG AAAAATGGCG 


AAATCGTTGA 


ACTGAATAAC 


ACAGAAGATA 


TTAT CAAACA 


8580 




TCCGCAGTCA GACTATGCAA AGCAACTTAT 


TTCAGAAGTA 


GCAGTTATTG 


CTAAATAAAA 


8640 




GTCATGCGTT GTGCAACTTT 


ATCACTGTAT 


GGTCTGAAAT 


AAATTGCGCG 


ACTT CTGATG 


8700 
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TATCAAGTTT 


TAGGTGCTTT 


GCCATGATTT 


AAGAGTCACC CCCATACTTT 


GGGCATTTTA 


8820 


ACGCCAGAAT 


AAATCCCCCG 


CCACTATGTG 


AAGTGTGGGG GATTATTTAT 


ATTTTATTAG 


8880 


AATATTCAGA 


TTTTTGAGTG 


TGTCAACTTA 


GCTTAGTCAA TGTATATTTA 


ACGTCACTTA 


8940 


CTCTTTTTCT 


TTCATAATTA 


ACACATTCAA 


ATAAACTTTG ATCAAAAAAC 


ACAAAGTTAA 


9000 


AAGTACCATC 


TTGTAATATG 


CTCTCATACA 


TTATCCCGTC ATATTTAAGG CTTCGAATAT 


9060 


AATCAGCTAA 


ATATTGAAAT 


GGCAAATAAT 


CTATTCCTTG TTCATCGCTT 


GGATTTGTTA 


9120 


TTCCTTTATG 


AATCTTTTTT 


AATGTTTGGT 


AATTTACAAA ATACTTTCTA 


AATCCAT CAT 


9180 


CGCCAGCTTT 


GATTGCATTA 


CTAGTTAAAT 


TAGTTAAATT CGCAATTTTC 


AATTTCT CTT 


9240 


TTGTCACGTT 


TTTTTGTAAC 


TTAACCTTAC 


CTATATAAAT AATGTCATTA 


TGCTTAGGTT 


9300 


TAACTTCTTC 


TATACTGACC 


TGTTCTTTTG 


TACTAAGGTA TAATACGCTT ATCCATTTAG 


9360 


AATTCAATCT 


TCCTGCCGTT 


GCAAATCCCT 


TTGGTGGTGA CATTAGTTCA 


CTTTTCTCTG 


9420 


TAATGAACTT 


AACTATTCTA 


GATCTATATA 


ATGGTTCAAA TCTTTCTCTA 


AATTCCTCAA 


9480 


TACTATAGTA 


ATTAGTAGTG 


ATATCGAGAA 


AGAACGCTAA ATTCTCTAAA 


TTGATCATAT 


9540 


TTTTATGAAA 


TCTATTTTTA 


TACTTCAAGC 


TCTCACAAAA TCCATCCCAG 


TCATTATTTG 


9600 


CTACAATTAG 


ATTTTTATTT 


GTATATTTTT 


TATCGTTTAT GATTTTAGCG 


CCTACTAAAT 


9660 


CTTCCAACAC 


TCGTCTATCT 


AAATTTTCAT 


CAT C TTTAAA AAGTTCATTT 


AAAATACAAC 


9720 


TTATTTGAGC 


TT CCTCAACA 


TTAAATATAC 


TCCAGTCGTC TTTTAATGCT ATTTCAATCT 


9780 


TTTTACCTTC 


TTTTGGGCTA 


AAAGTATCTG 


GTAAATTTAT ACT AATAT CA 


TATAATTCTA 


9840 


ATGCTGGTCT 


TAAATAATCT 


CTAATAAGTT 


CTAATTTATC TATGTCCTTA GTCGTATCAA 


9900 


ATATTTTAAC 


AC CAAGATG A 


TTGTTATCAA 


TATCACAATT GTCAAATTTG 


CTATTTATCA 


9960 


TTTGCAATGA 


TTTCTAC GAT 


TTCAGTATTA 


TTAAAACATT TTTCACATAT 


TTTCATTTTG 


10020 


AGACfCCAAG 


TATCTATTCA 


TAATTTCTAG 


GTGATGCATG ATAGATAACC 


TTTTAATTAA 


10080 


ACCTAATCCT 


GGATaCTTAT 


TATTTTCATT 


TAATTCTTCA AATTGTCCCA 


AGCGCATAAG 


10140 


AT CTATTTTT 


AATATCTAAG 


TTTTTTGACC 


ATGTTACTAA TT 




10182 



(2) INFORMATION FOR SEQ ID NO: 117: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3491 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



664 



EP 0 786 519 A2 



AACTCAGGCA ATTGAAACAG CATTAGGTGC 
AAAAGATGGA CGCCAGGCTA TTCAATTTTT 
5 TTTACCATTA AATGTTATAC AGAGTAGAGT 

AGAGGCAAAC GGATTTATTA GTATCGCTTC 
AAATATTATC GGGAATTTAT TAGGTAATAC 

w 

TGAATTGGCA CGTGCGATTA AATATCGAAC 
AAATCCTGGT GGtTCTATGA CTGGTGGTGG 

1S AAAAGACGAG TTGACAACAA TGAGACACCA 

ATTTGAACAA CAATTTAAAG AGTTGAAGAT 
TGAAAAAAGT CAAAAGCATA ATACACTTAA 

20 CGATAGATTA ACTACACAAG AAACACAAAT 

AAAAAATGAT GGTTATACGA GTGACAAAAG 
TCTAGAAAGT ATTAAAGCAT CTTTAAAACG 

25 ACTTTCTAAA GAAGGTAAGG AAAG CGTTAC 

ATCTGATCTT GCTGTGGTTA AAGAGCGTAT 
AAATAATCAA AATCAACAAA CTAAACATCA 

30 

CTTTAATTCG GAT GAAGTG A TGGGCGAACA 
TGGTCAACAA GAAACGAGAA CACGCTTATC 

35 TATTGAGTTG AATGAACAAA TCGATGCGCA 

TATTTTAGCT ATCGAAAATC ACTACCAAGA 
ATT AATT CAT CATGCGATAG ATCATTaAAT 

40 ArATCTGAAT ATACGaGTGA TG r ATCGATg 

AGaTGyCGAT TGATGrACTA GGTCCTGTAA 
TAAATGAACG TTATACATTT TTAAGTGAAC 

45 CATTAGAGCA AATTATAAGT G AAATGGAT C 

TCCATGCTAT TCAAGGACAT TTTACAGCTG 
CAGAATTGCA ATTAACTGAA GCCGATTATT 

SO 

CACCGGGTAA AAAGTTGCAA CATTTATCGT 
CTATTG CTTT ACTATTTGCA ATTTTAAAAG 



TTCATTACAA CATGTCATTG TAGATTCAGA 6 0 

AAAAGAACGT AATTTAGGTC GTGCGACGTT 12 0 

GGTAGCGACT GATATTAAAT CTATTGCTAA 180 

GGAAGCAGTT AAAGTAGCAC CAGAATATCA 24 0 

GATTATCGTT GATCATTTAA AGCATGCAAA 3 00 

TCGTATTGTT ACTTTGGAAG G TGATATTGT 36 0 

CGCTCGTAAG TCAAAAAGTA TTCTGTCTCA 420 

ATTAGAAGAT TACTTGCGTC AAACAGAATC 4 80 

AAAAAGTGAT CAATTAAGTG AACTGTATTT 54 0 

AGAG CAAGTG CATCATTTTG AAATGGAGCT 600 

AAAAAATGAT CATGaAGAAT TCGAATTTGA 660 

TCGACAAACT TTGAGTGAAA AAGAAACTTA 720 

ACTAGAAGAT GAAATTGAAC GCTACACAAA 78 0 

TAAAACACAA CAAACCTTAC AT CAG AAA CA 84 0 

TAAAACACAA CAACAGACAA TAGATCGATT 90 0 

ATTAAAAGAT GTTAAAGAAA AAATTGCATT 960 

AGCTTTTCAA AATATTAAAG ATCAAATTAA 1020 

AGATGAATTA GATAAATTGA AACAACAACG 1080 

AG AAG CTAAA CTACAAGTTT GTCACCAAGA 114 0 

TATTAAAGCT GAACAATCAA AG CTAG ATGT 1200 

GATGrATATC AATTGACTGT TGAACGTGCG 126 0 

ACGCATTACG TAAAAAAGTT AAGTTAATGr 13 2 0 

ACTTAAATGC AATTGAACAA TTTGAAG AG T 13 80 

AACGTACAGA TCTTCGTAAA GCTAAAGAAA 144 0 

AAGAGGTTAC TGAAAGATTT AAAGAAACTT 15 00 

TGTTCAAACA ATTGTTTGGT GGAGGCGATG 1560 

TAACAGCTGG TATTGATATT GTGGtACAAC 1620 

TACTGAGTGG TGGTGAGCGT GCATTAACTG 16 80 

TAAGATCTGC ACCTTTTGTT ATATTAGrTG 174 0 
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TATCAGACGA AACACAATTC ATTGTTATTA CACACCGTAA AGGAACAATG GAATTTGCAG 186 0 

ATAGGTTATA CGGTGTAACA ATGCAAGAAT CAGGTGTTAC TAAACTTGTG AGTGTGAATT 1920 

5 TAAATACAAT AGATGATGTG TTGAAGGAGG AGCAATAATG AGCTTTTTTA AACGCTTAAA 1980 

AGATAAGTTT GCAACAAATA AAGAAAATGA AGAAGTTAAA TCCTTAACAG AAGAACAAGG 2 04 0 

TCAAGACAAA TTAGAAGATA CACATTCTGA AGGTTCAACG CAGGACG CAA ATGATTTAGC 2100 

w 

AGAAAATGCT GAAGTGAAAA AGAAGCCACG CAAGTTGAGT GAAGCGGATT TTGATGACGA 216 0 

TGGCTTAATA TCAATTGAAG ATTTTGAAGA AATTGAAGCT CAAAAAATGG GTGCTAAATT 2220 

, 5 TAAAGCAGGA CTCGAAAAAT CTCGTCAAAA TTTCCAAGAA CAATTAAATA ATTTGATAGC 22 8 0 

GAGATATCGT AAAGTAGATG AAGACTTTTT TGAAGCTTTA GAAGAAATGT TAATCACTGC 234 0 

AGACGTCGGT TTTAATACAG TGATGACGTT AACTGAAGAA TTACGTATGG AAGCACAACG 24 0 0 

2° ACGTAATATT CAAGATACTG AAGATTTGCG TGAAGTCATT GTTGAAAAGA TCGTAGAGAT 24 60 

TTACCATCAA GAAGATkATA ATT CAGAAGC TATGAACTTA GAAGATGGTC GTTTAAATGT 252 0 

CATTTTAATG GTTGGTGTGA ATGGTGTTGG TAAAACAACA ACAATTGGAA AATTAGCTTA 25 BO 

25 CCGATATAAA ATGGAAGGTA AAAAAGTAAT GTTAGCTGCG GGCGATACTT TTAGAG CGGG 264 0 

TGCTATTGAT CAATTGAAAG TTTGGGGCGA ACGTGTTGGT GTAGACGTAA TTAGCCAAAG 270 0 

TGAAGGTTCT GATCCAGCTG CTGTTATGTA TGATGCgATT AATGCCGCTA AAAACAAAGG 276 0 

TGTTGATATT TTAATCTGTG ATACCGCTGG ACGTTTACAA AATAAmACAA ATCTAATGCm 282 0 

AGAATTAGAA AAAGTTAAGC GTGTAATTAA TCGAGCAGTG CCAGATGCGC CTCATGAAGC 288 0 

35 ATTACTATGT TTAGATGCTA CAACTGGT CA GAATGCGTTG TCACAAGCTA GAAACTTTAA 2 94 0 

AGAAGTAACA AATGTTACAG GTATTGTATT AACGAAATTA GATGGTACAG CCAAAGGTGG 300 0 

TATCGTATTA GCCATTCGTA ATGAATTGCA CATCCCAGTT AAATATG TAG GTTTAGGTGA 3060 

•to GCAATTAGAT GACTTACAAC CATTTAACCC TGAAAGTTAT GTCTACGGCT TATTCGCTGA 312 0 

TATGATTGAA CAAAATGAAG AAATAACAAC AGTTGAAAAT GATCAAATTG TAAGAGAAGA 3180 

AAAGGACGAT AATCATGGGT CAAAATGATT TAGTtAAAAC GTTACGAATG AATTATTTGT 324 0 

45 TTGATTTTaT CAATCCTTAT TGACGAATAA ACAACGTaAT TATTTGGAAT TATTTTATCT 33 00 

TGAAGATTAT TCTTTAAGTG AAATCGCAGa TACTTTTAAT GTGAGTAGaC AAGCAGTTTA 33 6 0 

TGATAATATA AGAAGAACTG GCGATTTAGT TGAAGATTAT GAAAAGAAAT TGGAATTATA 34 2 0 

50 

CCAGAAATTT GAGCAACGCC GAGAAATATA TGATGAAATG AAACCACATT TAAGTAAT CC 3480 

AGAACAAATA C 34 91 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 4253 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



<xi] SEQUENCE DESCRIPTION : SEQ ID NO: 118: 





AGTACGTTTT ATAATTATAA 


GTACGTAATT 


AACATATTAA CATATCGCAA 


GTATGTATTT 


60 




AAATAAgATT GTTATAATTT 


CAAAGTTCAT 


CCAAGaTTAT GGCGTTTGCA 


TTTACCTATT 


120 


15 


AAAAACGTTA TTATATCAAA 


GATGCGAAAG 


ATAATACGGG TTTATTTTAT 


GAAAGTGAGA 


180 




AGGATAAAAT GGATAATGAG 


CAACGCTTAA 


AAAGAAGAGA GAATATAAGG 


AATTTCTCGA 


240 




TTATAGCACA TATTGACCAC 


GGAAAATCTA 


CATTGGCTGA TAGAATTTTA 


GAAAATACCA 


300 


20 


AATCAGTTGA AACAAGAGAT 


ATGCAAGATC 


AGTTACTAGA TTCAATGGAT 


TTAGAAAGAG 


360 




AACGTGGTAT TACAATCAAA 


TTAAACGCgT ACGTTTAAAG TACGAAGCTA 


AAGATGGAAA 


420 




TACTTATACA TTCCATTTAA 


TCGATACGCC 


TGGACACGTC GATTTTACAT 


ATGAAGTGTC 


480 


25 


ACGTTcTTTG GCAGCTTGTG 


AGGGCGCGAT 


TTTAGTAGTA GATGCGGCTC 


AAGGTATCGA 


54 0 




AGCACAAACA TTAGCAAATG 


TTTATTTAGC 


ATTAGATAAT GAGTTAGAGT 


TATTGCCTGT 


600 




TATTAACAAA AT TG ATTTAC 


CTGCTGCAGA 


ACCTGAACGC GTGAAACAAG 


AAATTGAAGA 


660 




TATGATAGGT TTAGACCAAG 


ACGATGTTGT 


TTTAGCAAGT GCTAAATCTA 


ACATTGGAAT 


720 




TGAAGAGATA CTAGAGAAAA TAGTTGAAGT 


TGTGCCAGCT CCAGATGGTG 


ACCCAGAAGC 


780 


35 


ACCACTAAAA GCGTTAATAT 


TTGATTCTGA 


GTATGATCCA TATAGAGGGG 


TAATTTCATC 


840 




GATAAGAATT GTGGACGGTG 


TTGTTAAAGC 


CGGAGATAAA ATTCGAATGA 


TGGCCACTGG 


900 




TAAAGAGTTC GAAGTAACAG 


AAGTTGGAAT 


TAATACACCT AAGCAGCTTC 


CAGTTGATGA 


960 


40 


ATTAACAGTT GGTGATGTTG GTTATATTAT 


TGCAAGTATT AAAAATGTTG 


ATGATTCTAG 


1020 




GGTTGGTGAC AC CAT CACAT 


TAGCTAGTAG 


ACCTGCATCA GAACCATTGC 


AAGGTTATAA 


1080 




GAAAATGAAT CCAATGGTAT 


ATTGCGGACT 


GTTCCCAATA GATAACAAAA 


ATTATAATGA 


1140 


45 


TTTAAGAGAA G CATTAG AAA 


AATTACAATT 


GAATGATGCA TCATTAGAAT 


TTGAGCCTGA 


1200 




ATCGTCACAA G CATTAGGTT 


TTGGTTATAG 


AACTGGTTTC TTAGGTATGT 


TACACATGGA 


1260 


SO 


AATAATTCAA GAAAGAATTG 


AAAGAGAATT 


TGGTATTGAA TTAATTGCAA 


CTGCACCATC 


1320 




TGTAATTTAT CAATGTGTTT 


TAAGGGACGG 


TTCAGAAGTG ACGGTTGATA 


ACCCAGCACA 


1380 




AATGCCAGAT CGTGATAAAA 


TTGATAAAAT ATTTGAGCCA TATGTTCGTG 


CAaCTATGAT 


1440 
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TATAAATATG GACTATTTAG ATGATATTCG TGTAAATATT GTTTATGAAT TACCTTTAGC 156 0 

TGAAGTTGTA TTTGATTTCT TCGATCAACT TAAATCTAAT ACTAAAGGAT ATGCATCATT 16 2 0 

TGATTATGAA TT C ATCGAAA AT AAAG AAAG TAATTTAGTC AAGATGGATA TTTTATTAAA 16 8 0 

TGG TG AT AAA GTGGATGCGC TAAGCTTCAT AGTTCATAGA G ATTTTG CAT ATGAACGTGG 174 0 

TAAAGCATTA GTTGAAAAAC TTAAAACGTT AATTCCAAGA C AG CAATTTG AAGTACCTGT 1800 

ACAGGCTGCA ATAGGACAAA AAATTGTAGC GCGTACAAAT ATTAAATCAA TGGGTAAAAA 18 6 0 

CGTTTTAGCT AAATGTTATG GCGGTGACAT AAGC CGTAAA CGTAAATTAC TTGAAAAACA 192 0 

AAAAG CAGGT AAAGCTAAGA TGAAAGCAGT TGGTAATGTT GAAATTCCAC AAGATGCTTT 1980 

CTTGGCTGTA TTGAAAATGG ATGATGAATA ATTTTAAAAA ATCAATTAAC AATTTACAAT 204 0 

GAATAAAGTT TAATAACTAA AAAGAGGGAG CCTAGGATAA ATTAACGTCC TGGGCTTTAC 2100 

AATGTTATAT TGG CAG C CAT CGACAGAGTT AAAATGAGCT TATAACAATG GGGCCCCAAC 216 0 

ACAGAAGCTG ACGAAAAGTC AGCTTACTAT AATGTGCAAG TTGGGGTGGG GCCCCAACAT 22 2 0 

AGAGAATTTC GAAAAGAAAT TCTACAGGCA ATGCAAGTTG GGGTGGGACG ACGAAATAAA 22 8 0 

TTTTGCGAAA ATATCATTTC TGTCCCACTC CCTTATGCAT GAGTTTTACT CATGTAATTT 234 0 

TATTTTTAAG GACATATTAC ATCTGGCTAA TGTGTAAGAG CCACTACATA ATAAATCATT 24 0 0 

AGTGGTTCTT TATTATTTCT ATCTCACTCC CTCTAAACAA GAATAAATAT TAAAATGAAT 24 6 0 

CGATATATTA GACAATCATT G ATT AAA CGT TAAAGTTAAA AGTAAGAATA ATTG CAG ATA 2 52 0 

GTCCAACAGG ATATAGCCGA TTGGATAAAA AGTCTGAGAA GCGGGGCATT AAAATGACGG 2 580 

TACAAAGTGC ATATATACAT ATTCCATTTT GTGTAAGAAT ATGTACATAT TGTGATTTCA 264 0 

ATAAATATTT TATACAGAAT CAACCTGTAG ATGAGTACTT AGATGCACTA ATCACAGAAA 27 0 0 

TGTCTACAGC AAAATATAGG ATCTTAAAGA CCATGTATGT AGGTGGCGGC ACAC CAACGG 27 6 0 

CCCTTTCTAT TAATCaGTTG GAAAGATTAC TTAAAGCAAT A CGTGATACG TTTACAATCA 282 0 

CAGGCGAGTA TACATTTGAA GCAAATCCTG ATGAGTTAAC TAAAGAGAAA GTCCAACTAT 2 880 

TAGAGAAATA TGGAGTAAAA AGGATTTCAA TGGGCGTTCA AACATTCAAG CCGGAGTTAT 2 94 0 

TGTCTGTTTT AGGTAGAACG CACAATACTG AAGATATTTA CACTTCGGTG TTAAATGCTA 3000 

AAAACGCAGG TATTAAATCA ATCAGTTTAG ATTTAATGTA T CATTTACCG AAACAGACGA 3 06 0 

TTGAAGATTT TGAACAAAGT TTAGATCTAG CTTTAGATAT GGATATTCAA CATATTTCGA 312 0 

GTTACGGCTT AATACTTGAA CCTAAAACCC AATTTTATAA TATGTATAGA AAAGGCTTGC 318 0 

TCAAACTTGC TAATGAGGAT TTAGGTGCTG ACATGTATCA GTTGCTGATG TCTAAGATAG 324 0 
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AACATAATAA GGTTTACTGG 
GTTATGTAGA TGGTGTGCGT 

5 

TAAATAAAGA AAGTAAAGCA 
AAGAAGAAAT GTTTCTTGGG 
AGAAGTTTGA CCAATCTATT 

w 

AGGAATTAAT TGTAGAAAAG 

GTAATGAGGT TTTTGAAGCT 
15 TTAACATTGA CTTACTTTGA 

TGCTAATGAG GTGAAAACAT 

GAGGATTATG TTGATTTTGG 
20 TTGAATGTTA GTCCTGCTAC 

ATCGAGAAGA CACATAGTTC 

GTCAATCGTT TACTTGAACA 

25 

CAATTGTTAG TTGAGAATCA 

TTATCAAATA TATCTCAATA 

ATCAATAATG TACACTTGAT 

(2) INFORMATION FOR SEQ ID NO: 119: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3395 base pairs 
3S (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



"(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 119: 



TCCCTAATCG 


AACAAAATTA 


TGCGCATAAA 


CAAAGTAGAT TGATATAAAA 


TTCTTAATTA 


60 


TCAGAATATA 


TTTACAAATC 


TGAATTTTAT 


TAGTATATTG GrTAGTrTTC 


ATAGAGGCAT 


120 


GACGGTaTTT GAGCAGGATT TTAAATCGGg ATTTTATAAT CGATTTAAGA 


GAGGCCACtT 


180 


TGCTTGcACA 


TTAATACTGT 


cAATGGGAGG 


GGAATGTATA TGAGTrAAGC 


ACATCAATTA 


240 


ATTCAAGAGG 


ATGAACATTA 


TTTTGCGAAA 


TCAGGACGTA TTAAATATTA 


TCCGTTAGTG 


300 


ATTGATCATG 


GATATGGAGC 


AACATTGGTT 


GATATTGAGG GGAAGACATA 


TATCGATTTG 


360 


TTATCGAGTG 


CGAGTTCTCA 


AAACGTAGGT 


CATGCAC CTA GAGAAGTAAC 


AGAAGCGATA 


420 



TTTAATGAGG AATATTATGG ATTTGGAGCA GGTGCAAGTG 3360 

TATACGAATA TCAATCCAGT GAATCATTAT ATCAAAGCTA 34 2 0 

ATTTTAGTAT CAAATAAACC TTCTTTGACT GAGAGAATGG 34 80 

TTGCGTTTAA ATGAAGGTGT GAGTAGTAGT AGGTTCAAAA 3 54 0 

GAAAGTGTCT TTGGTCAAAC AATAAATAAT TTAAAAGAGA 3 6 00 

AACGATGTGA TTGCACTTAC AAATAGAGGG AAAGTCATAG 3 660 

TTCCTAATAA ATGATTAAAA AAAATTGAAA TTTCGAGTCT 3 720 

CCAATTTGAT AAATTATAAT TAG CACTTGA GATAAGTGAG 37 80 

GATTACAGAT AGGCAATTGA GTATATTAAA CGCAATTGTT 3 84 0 

ACAACCCGTT GGTTCTAAAA CACTAATTGA GCGACATAAC 3 9 00 

AATTAGAAAT GAGATGAAAC AGCTTGAAGA TTTAAACTAT 3 960 

TTCAGGGCGT TCGCCATCAC AATTAGGTTT TAGGTATTAT 4 020 

AACATCTCAT CAAAAAACAA ATAAATTAAG A CGATTAAAT 4 0 80 

ATATGATGTA TCATCAGCAT TGACATATTT TGCAGATGAA 414 0 

TACAACTTTA GTTGTTCATC CTAATCATAA ACAAGATATT 4200 

TCGTGCTAAT CCTAATTTAG TTATAATGGT TAT 4 2 53 
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GTACGTTTAG CTAAGAAGCT TTG TGAGATT GCACCTGGAG ATTTTGAAAA AAGAGTGACC 54 0 

TTCGGATTAA CCGGATCAGA CGCAAATGAT GGCATCATTA AATTTGC CAG AG CATATAC A 6 00 

GGGCGTCCTT ATATCATTAG TTTCACTAAT GCATATCATG GTTCAACTTT TGGCTCATTG 6 60 

TCTATGTCAG CTATTAGTTT AAATATGCGC AAACATTATG GTCCGTTATT GAATGGTTTT 72 0 

TATCATATTC CGTTTCCAGA TAAATATCGT GGTATGTACG AGCAGCCACA AGCTAATTCA 78 0 

GTAGAAGAAT ATTTAGCACC CTTAAAAGAA ATGTTTGCGA AGTATGTACC TGCTGACGAA 84 0 

GTAGCATGTA TTGTTATTGA AACGATACAA GGCGATGGTG GACTTTTAGA ACCAGTTCCA 90 0 

GGGTATTTTG AAGCGTTAGA AAAGATTTGT CGTGAACATG GTATTTTAAT CGCTGTCGAT 960 

GATATTCAAC AAGGTTTTGG GAG AACAGG T ACATGGAGTT CAGTCTCGCA TTTTAATTTT 1020 

ACGCCTGATT TAATCACTTT CGGAAAATCC TTAGCAGGTG GTATGCCTAT GTCAGCAATT 108 0 

GTTGGACGCA AAGAGATTAT GAATTGTTTA GAAGCACCAG CACATTTATT TACAACAGGT 114 0 

GCTAATCCAG TTAGTTGTGA AGCTGCATTA GCCACAATTC AAATGATTGA AGATCAGTCG 1200 

CTTCTTCAGG CTAGTG CGGA AAAAGGGGAA TATGTTAGGA AACGAATGGA TCAATGGGTA 126 0 

TCTAAATACA ATAGTGTAGG CGATGTTAGA GGTAAAGGTC TGAGCATTGG TATTGATATT 132 0 

GTTTC CGACA AAAAACTCAA AACACGTGAT GCCAGTGCGG CACTTAAAAT TTGTAATTAC 13 80 

TGCTTTGAGC ATGGCGTAGT TATTATAGCT GTAGCAGGAA ATGTGTTGCG ATTCCAACCG 1440 

CCATTGGTAA TAACATATGA GCAATTAGAC ACGGCGTTAA ACACTATAGA AGATGCACTG 150 0 

ACTGCTTTGG AAGCAGGTAA CTTAGATCAA TATGACATAT CTGGACAAGG TTGGTAATAG 1560 

CGATTATCTT AATATAAAAT AAAAAATCAT TTCCACATCT GGATGTTAAT CAGATGGGAA 1620 

ATGATTTTTT TTATTTTTTA TTTTGGTGGG TGGTATTCAG CTACGTCATT TTTCTTAGAA 16 80 

TGTGTAAGTC CATAACTTAA ATATAGGATG ATACCAACAA TAAACCAAAT TAAAGTGTAT 174 0 

AATTTCGCTT CGAATCCTAA TCCCCAGAAT ACTAGCAATA CTAAAACAAA TGTAATTGCT 180 0 

GGTAACACAG GATATAAAGG TAATTTAAAT GCAGGAATTG GTAGATCTTT ACCTTcACGC 1860 

TTTCTCAAAC GATACATTGC TAATGAAACG AACATAAATG CAACAAGTGT ACCTGCTGAA 192 0 

ATTAATTGTG CTAAAAATGC GAATGGGAAC ATAGAACCAA TTAAAACACC AATAATAGTA 198 0 

AGTATAACTA GTGCGCGATT AGGTAAATGT TTGTCGTTTA AGTGGCTTAA CCATGAAGGT 2 04 0 

AATAAGCCGT CACGTCCAAA TGAATAAAGT AAACGTGAGC CTGCTAACAT CATACCAATT 210 0 

AATGCTGTAA ACATACCGAT AACAGAGATA GCTTGAACAA TAGCTGCTAC AACACCATGA 2160 

CCACTTTGAC GTAAAGCCCA ACCAACAGGT TCAGCATTGT TTGCGTATTG TGAGTAATGG 2220 
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CCAAGAATAC CTCTAGGCAT TGTCTTTTGA GG AT CAAGTG CTTCTGCTGA GTTTGCTGCG 23 4 0 

ATAGAATCGA AACCGATATA CGCTAAGAAA ATCATTGAAA CACCAGCATA TATGCCTTGC 24 0 0 

s 

CATCCACCAA AGTCACCTGT AGCAGTTACT TTGTGTTCTG GAATAAATGG CACAT AG TTA 24 6 0 

CTAACATTTA TTGCTGTTAA AC CTACG ATG ACAAATAAAA TAATAG CTAA TACTTTTAAA 252 0 

ATAACTAAAA TATTTTCCAT ACGAGCTGCT TCCGACATAC CACGTGATAG TAATAATGCA 2580 

GTTAATAAAA TAACGATAGC AG CAAT AAT A TCGATAAAAC CGCCATTTGT ACCAAATGGA 264 0 

TTTGATAATG CTGCAGGTAA TTCGATGCCA ATTGGTTTCA CAAGTCCGCG TAAATTCGCT 2700 

j5 GAGAATCCTG ATGCAACAAA GGCTACGGCG ATAAAATATT CAGCTAATAG AGCCCAACCG 2 76 0 

GCAACCCATC CAAAAAATTC AC CAAATAAT ACATTGACCC AAGAATAGGC TGAACCTGCA 2 8 20 

AATGGCATAG CGGCAGCCAT TTCTGCATAA GTAAATGCAA CTAAACCAGC AA CAAT AG CA 2 880 

20 GCGAGTAAGA ATGATAACGC AACGGCCGGT CCTGCATGTT CTGCAGCAAC AATGCCAGGT 2 94 0 

AGCGTAAAGA TAGATGTCGA TACAATTGTT CCTACACCTA AAGCTAAGAA ATCACGCACC 3 00 0 

CGAAGTGTAC GCTTTAAATG ACCATCTTTA TTTTGATAGA TAGCCGGATC CTCTTTTCGT 3 06 0 

25 GCTATTTTAT TGAAAAAACT TCCCATAAAC TTTCCTCCCA AACATTCATA AACAATTCTA 3120 

TACGGTGTTT TTTAATATGT TATATCATAG CACAAATAAT CAATATTTTG TCTAAAAATT 3180 

CTGAAAAATC ACAACTTTAT GTTACGTATT AATGACTTGT CTTGATAACA TCCATAGATT 324 0 

30 

TTTTAAATGA TAAAACTGAT TATAACAGAT ATTAAATGAA TAAGTACTAT TTTTTGCnAA 33 00 

TTTTCTAACA ATTTTGCACA TTATATGTTT AAAATCAATT TCATGTTTAT GGTCTGATTG 3 36 0 

GCTAGTGTGT ATGAAATGTA AnTCTTTGAC TnnGA 3 3 95 

35 

(2) INFORMATION FOR SEQ ID NO: 120: 

" (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13508 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 120: 

ATCAGGTAAT GCCATGCGTT TAGCTGAAAA TTTTTTCAGA ACGTTTAAGT GATATCGGAC 60 

ATCAAGTTGT TTTGATGTCA ATGGATGAAT ATGATACGAC AAACAT CGCG CAGTTAG AAG 120 

50 

ATTTATTTAT TATTACGTCT ACTCATGGTG AAGGAGAACC GCCTGATAAT GCATGGGATT 18 0 

TCTTTGAATT TTTAGAAGAC GATAACG CAC CTAA TTT AAA TCATGTGAGA TATTCAGTAC 24 0 
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TACTAGAAAA TCTAGGCGCT GAGCGTATAT GTAAGCGTGT AGATTGTGAT ATTGATTATG 360 

AAGAAGACGC AGAAAAGTGG ATGGCAGACA TCATTAATAT TATTGATACC ACATCAGAAG 42 0 

£ GTATTCAAAG TGAATCGGTG ATAAGTGAAT CAATTAAGTC TGCCAAAGAA AAGAAATATT 4 80 

CTAAATCAAA TCCATACCAA GCAGAAGTAT TAG CGAATAT CAATTTAAAT GGTACCGATT 54 0 

CAAATAAAGA AACACGACAT ATAGAATTTT TACTTGATGA TTTTAGTGAA TCATATGAAC 6 00 

CAGGAGATTG TATAGTAGCA TTACCGCAAA ACGACCCTGA ATTGGTTGAA AAACTAATAT 66 0 

CCATGTTAGG TTGGGATCCG CAATCTCCGG TGCCAATTAA TGATCATGGT GATACAGTTC 72 0 

1S CTATTG TTGA AGCACTAACA TCACATTTTG AATTTACTAA ATTAACATTG CCATTATTGA 78 0 

AAAATGCAGA TATCTATTTT GACAATGAAG AATTATCTGA ACGTATTCAA GATGAGTCAT 84 0 

GGGCGCGTGA ATATGTTATA AATCGGGACT TTATAGATTT AATAACAGAT TTTCCAACTA 90 0 

20 TAGAATTACA AC CTG AGAAT ATGTATCAAA TCCTTAGAAA ATTACCACCA AGAGAGTATT 96 0 

CGATTTCTAG TAGTTTTATG GCAACGCcAG ATGAAGTGCA TATTACCGTT GGTACGGTTC 102 0 

GTTATCAAGC ACATGGACGT GAGAGAAAAG GTGTATGCTC GGTTCATTTT GCTGAGCGAA 1080 

25 TTAAACCAGG CGATATAGTA CCAATTTATT TGAAGAAAAA TCCGAACTTC AAATTTCCGA 114 0 

TGAAGCAAGA TATAC CGG TT ATTATGATTG GACCAGGTAC TGrAATTGCT CCTTTTAGAG 12 0 0 

CATATTTACA AGAACGTGAA GAACTTGGTA TGACTGGAAA AACATGGTTG TTCTTTGGTG 126 0 

30 

ATCAACACCG TAGTTCTGAC TTTTTATATG AAGAAGAAAT AGAAGAATGG CTTGAAAATG 132 0 

GAAACTTAAC ACGCGTAGAT TTAG CATTTT CAAGAGACCA AGAACACAAA GAATATGTAC 13 8 0 

AGCATCGTAT AATGGAAGAA AGTAAACGTT TCAATGAATG GATTGAGCAA GGCGCACAAT 144 0 

35 

CTATATTTGT GGCGATGAAA AATGTATGGC GAAAGATGTC CATCAAGCCA TTAAAGATGT 150 0 

ATTGGTAAAA GAACGTCATA TTTCTCAAGA AGAAGCAGAG TTATTATTGC GACAAATGAA 156 0 

40 ACAACAACAA CGCTATCAAC GTGATGTTTA TTAGCGATTG GTGTTAAATA TTTTAAGGTG 162 0 

TAATGATGTA AAAAGATATA AAGGATGTTG CTCAACATGA ATATG CCATT AATGATAGAT 16 8 0 

TTAACAAATA AAAATGTCGT CATAGTTGGT GGAGGCGTCG TTGCAAGTCG TCGGGCACAA 174 0 

45 ACATTAAATC AATACGTTGA ACATATGACG GTCATCAGTC CGACAATCAC TGAAAAACTT 1800 

CAAAATATGG TAGATAACGG TGTCGTCATA TGGAAAGAAA AAGAATTTGA ACCAAG CGAT 186 0 

ATTGTAGACG CGTATCTAGT TATTGCAGCA ACCAATGAGC CACGTGTCAA TGAAGCGGTA 192 0 

50 

AAAAAAGCCT TACCTGAGCA TGCCCTTTTT AATAATGTTG GAGATGCATC AAATGG CAAT 198 0 

GTTGTATTTC CAAGTGCACT ACACCGCGAC AAGCTAACTA TCAGTGTATC AACTGATGGT 2 04 0 

55 
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TACAGTTCGT ATATCGACTT TTTATATACT TGCCGACAGA AAATAAAAGT ACTTGATATA 216 0 

ACATATAACG AAAAGCAACA GTTACTGTCA CAAATTGTGT CACAAGAATA TTTAAATCAT 22 20 

5 GACAAACAAG CTCAATTTTT AGCGTGGTTG GATGTAAGAT AATAATAGCG GACCGTCTAA 2 2 80 

CCGTCTAAGG TAAGTCTTCT TATTTTAACT TTAAC GCTTA ATCATTGAAA TTAAGACATG 2 34 0 

GGCGGCTTTG TGAATAGTCT AATAATGAAG GATTTAAGCG ATAATGATAT GCGTTTTAAA 24 0 0 

10 

TATGAATATT ACAATAGAGA AAAAGATACG TAGAACAAAC TTAATAAAAT AGGTGGATAA 24 6 0 

ATTGAAATCT GGTTGAAGTC GTTACTATCA TAGCGACCTT TAGCCAGATT TTTTGTGCAA 252 0 

js TAG AAAG CAA TAATAAAAAT GATAGATCAA AATGAAATAC AGGACAGGAT ATACAAGGAT 2580 

TAGTCATG CC ATGTTATCAA GTAGGAAAAT CAAACTTCAC TATTGATAGT TACGCAAAAA 26 4 0 

AGATTTTTTT GATAAAATGA GATAACTTAA ATATAAAAAA TTATATTAAT TATAATATTT 2 70 0 

20 AAGTTAAAGA GGGGGATTAT GTAAATTGTA TTAAAAGTGG AGGGAGAAAA TAATATGAAT 27 6 0 

AGTGATAATA TGTGGTTAAC AGTAATG GGG CTCATTATTA TTATTTCAAT TGTAGGTTTA 282 0 

CTCATTG CCA AAAAGATAAA TCCAGTTGTA GGTATGACAA TCATACCTTG CTTAGGGGCA 2 8 80 

25 ATGATTTTAG GATATAGTGT GACAGATTTG GTTGGATTTT TTG CTAAAGG GTTAGATCAA 2 94 0 

GTCATCAACG TTGTTATTAT GTTTATCTTT G CCATTATTT TCTTTGGCAT CATGAACGAT 3 000 

AGTGGTTTAT TCAAGCCGCT TGTCAAACGC TTAATATTAA TGACACGAGG CAATGTCGTC 3 06 0 

30 

ATTGTCTGTG CAATGACAGC TTTAATT GG C ACAATAGCCC AATTAGATGG GGCCGGTGCG 312 0 

GTAACATTTT TGCTTTCTAT TCCTGCATTA TTACCTTTAT ATAAAGCGTT AAATATGAAT 3180 

AAATATTTAT TGATTTTACT ATTAGCATTA AGCGCGGCGA TTATGAACAT GGTACCTTGG 3 24 0 

35 

GGAGGTCCAA TGGCTCGTGT AGCTGCAGTG TTAAAAGCCA AAAGTGTCAA TGAATTATGG 3 3 00 

TATGEATTAA TACCTATTCA AATAATAGGT TTCATTCTTG TTATGTTGTT TGCGGTATAT 3 360 

40 CTTGGATTTA AAGAACAGAA ACGTATCAAA AAAGCAATAG AGAGAAATGA ATTACCGCAA 34 20 

ACACAAGATA TAGATGTACA TAAATTAGTT GAAGTATATG AACGAGATCA AGATGTAAGG 34 8 0 

TTTCCTGTAA AAGGACGTGC AAGAACAAAA TCATGGATAA AATGGGTGAA TACAGCTTTA 3 540 

45 ACTTTAGCTG TTATTCTATC GATGTTAATA AATATTGCGC CACCTGAATT TGCATTCATG 3 6 00 

ATAGGTGTTy CGTTGGCACT TGTTATTAAT TTTAAATCAG TGGATGAACA AATGGAACGA 3 6 60 

TTAAGAGCgC ATGCGCCGAA TGCATTAATG ATGGCTGCAG TGATTATTGC AGCAGGTATG 3 720 

50 

TTTTTAGGTG TACTAAATGA AACCGGTATG CTTAAAGCGA TTGCGACCAA TTTAATCAAA 37 8 0 

GTGATTCCTG CAGAAGTAGG ACCATACTTG CATATTATTG TAGGTTTACT TGGCGTACCA 3 84 0 
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ACAGCAGGGC AATTTGGTGT ACCGTCTGTA TCAACAGCTT ATTCAATGGT CATAGGGAAT 3 96 0 

ATTATAGGTA CATTTGTCAG CCCATTTTCA CCAGCCTTAT GGTTGGCAAT TGGTTTAGCA 4 02 0 

GAGGCAAACA TGGGCACGTA TATTAAGTAT GCATTCTTTT GGATTTGGGG ATTCGCTATC 4 08 0 

GTTATGTTAG TAATTGCAAT GTTGATGGGC ATTGTGACGA TTTAAGTATG AAAAAATAGA 414 0 

AACTATGGTC ACGTTGCAAA ATGAAATAAT AGTTGCATAA ACATGTCGAA ATGACGGACG 4 2 00 

AATCTTTAAA CAATTTTAAA AATTAATGAA ATAATTGTGT AGAAATATGA ATTTCACTAA 42 6 0 

ATGTTAATAA CTTTGTGACG TTTTAGTTAA CAGACTAATA AAAATTTGAA AATACTATAT 4 32 0 

ATAGTGGTAT AACGTAATGA GTAGACACAA TATATAGGAA GAAGGGGTAA AATGAATCAA 43 80 

ATCGAAGAAG CATTAACGGG TTTGATTTCT AAAGATCCTG CTATTGTTAA CGAAAATGCT 444 0 

AACAAAGATA GTGATACATT TTCAACAATG AGAGATTTAA CAGCAGGTAT CGTTTCTAAA 4 500 

TCTTACGCAT TAAATCATTT ATTACCAAAG CACGTTGCAG ATGCACATCA AAGAGGGGAC 4 56 0 

ATACATTTTC ACGACTTAGA TTATCATCCA TTCCAACCGT TAACTAACTG TTG TTTAATA 4 620 

GATG CTAAAA ATATG CTACA TAATG GATTT GAAATAGGCA ACGCGAATGT AACTTCACCA 468 0 

AAATCAATAC AAACTGCATC AG CG CAGCTT GTACAAATTA TAGCCAATGT TTCTAGCAGT 4 74 0 

CAATATGGTG GCTGTAcGGT TGACCgCGTT GACGAATTAC t TAGT ACATA TGCACGACcA 48 00 

TAATG AAGAA CAACATAGGA ATATsCGCAA AGCAATTTGT CAAAGAATCT GAAATTGATC 4 86 0 

GTTATGTTGA TCAACAAGTC ACTAAAGACA TCAATGATGC GATTGAAAGT TTAGAATATG 4 92 0 

AAATTAATAC CTTATATACA TCTAATGGAC AGACACCTTT TGTAACATTA GGATTCGGCT 4 98 0 

TAGGTACAGA TCATTTAAGT CGCAAAATTC AACAAGC TAT CTTAAATACT CGTATCAAAG 504 0 

GCTTAGGAAA AGACCGCACG ACAGCGATTT TCCCGAAACT TGTATTTTCA ATTAAAAAAG 510 0 

GAACCAACTT TAGTCCGCAA GATCCGAACT ATGACATTAA ACAACTAGCA TTAAAGTGTT 5160 

CAACGAAACG TATGTATCCA GATATTTTAA ATTATGACAA ACTCGTAGAA ATATTAGGTG 522 0 

ATTTCAAAGC GCCAATGGGT TGTCGTTCAT TTTTACCAAG TTGGAAAGAT GCGGAAGGTC 52 8 0 

ATTTTGAAAA TAATGGTCGT TGTAATCTTG GTGTTGTTAC ACTTAATTTA CCTAGAATGG 53 4 0 

CATTAGAATC TGCCGGTAAT ATGACGAAAT TCTGGGAAAT CTTTTATGAA CGTATCGATG 54 00 

TGTTACATGA TGCATTACTT TATCGTATAA ATCGTTTGAA AGATGCTGTA CCGAATAACG 54 60 

CACCGATTTT ATATAAAAGT GGCGCATTTA ACTATAAATT AAAAGAAACA GATGATGTTG 5520 

CTGAGTTATT TAAAAATAAA CGTGCAACGA TTTCAATGGG CTATATAGGG TTGTATGAAA 5 580 

CAGCTACTGT TTTCTATGGT CCAGACTGGG AAACATCTCA AGAAGCAAAA GCATTTACGC 5 64 0 
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GGTTCAGTAT TTmCAGTACG CCGAGTGAAT CGCTAcGGAT CGTTTTTGTC G TTTAG ACCA 5 7 60 

AGAGAGATTT GGAGATATTA AAGACATTAC AGATAAAGGA TATTATCAAA ACTCTTTCCA 5 82 0 

5 

TTATGATGTA CGTAAAGATG TTACAC CTTT TGAAAAGTTA GATTTTGAAA AAGATTATCC 5 8 80 

TTATTATGCG AGTGGTGGTT TCATTCACTA TTGTGAGTAT CCGAAATTGC AACACAATTT 5 94 0 

GAAAGCACTA GAAGCGGTAT GGGACTACTC TTATGACAAA GTTGGTTACT TAGGTACAAA 6000 

10 

TATTCCGATT GATCATTGTT ATGAATGTGA TTACGATGGA GATTTTGAAG CAACTGAAAA €06 0 

AGGATTTAAA TGCCCGAACT GTGGCAATGA TAATCCTAAA ACAGTTGATG TCGTTAAACG 612 0 

JS AACATGTGGT TACCTAGGCA ATCCAGTTCA ACGTCCAGTA ATTAAAGGCC GTCATAAAGA 618 0 

AATTTGCGCA CGAGTAAAAC ATATGAAAGC GC CTAAAGAA TGATACTTTT AGACATTAAA 624 0 

CAAGGACAAG GTTATATTGC TAAAATAGAA TCAAATAGCT TTGTTGACGG TGAAGGAGTA 63 0 0 

20 AGATGCAGTG TTTATGTATC AGGATGTCCA TTTAATTGTG TTGGATGTTA TAACAAAGCC 63 6 0 

TCACAAAAGT TCAGATATGG CGAGAAATAC ACTGATGAAA TATTAGCAGA AATATTAGAT 64 2 0 

GATTGCGATC ATGATTATAT ATCTGGGCTA AGTCTATTAG GTGGCGAACC ATTTTGTAAT 64 8 0 

2b TTGGATATTA CATTAAATCT TGTCAAAGCA TTTCGAGCAC GTTTTGGAAA TACAAAGACA 6 54 0 

ATTTGGGTAT GGACTGGATT TTTATATGAA TATTTAGCAA ATGATTGTAC AGAACGTCGA 6600 

GAGTTATTAT CATACATTGA CGTTTTAGTA GATGGTCTAT TTATACAACA CTTATTCAAA 666 0 

30 

CCTGATTTAC CATATAAAGG TTCTTTAAAT CAACGCATTA TAGATGTACA ACAATCACTC 672 0 

TCGCATGCGC GTATGATTGA ATATATAGTT AGTT GAATAT GTATTAGAAG TCAAGGTAAC 67 80 

ATTCGTTGCC TTGGCTTCTT TTTAGGTTAG GTACATAATT GAAAGTTAAT AAAAGCAATT 6 84 0 

35 

CTTTATAAAA ATATATTGAT AGAATATGAC CTAACAATCA TTTTGATACC AATACTAAAA 6 900 

GTTGCATATC CGTTTTTTAA AAAAGTTGAA AGAGAAAAGT GGTATTTTAG TGGGAAGGAA 6 960 

40 GTCTAACTTT TTGGTAGCGT T TTACAATAA ATAAATATTC GTTAATAACG TATAAATATT 7020 

CTTAAATGCC ATT CTAGTAA AATTTGTTAA ATTCGTTAAA TCGTAACTTA ACACTGTTAT 7 08 0 

TTTAGC GCT A TTAAGGTTTT GTTTATTACG GGAAAAATTA TATAAATATT CAATAATTGC 7140 

45 CAAGTTTCAA ATTGTATGAA ATTTGCATTA TTATTAAATG TTAG TTATTG TCAATTTTGT 7200 

GAATCAATAT AATTATTACA TTTTGAGATA AATCGAAACA GGATTCATAA AATTAATAAT 7260 

TAGGGGGAGC ACAATTGAAA AAAGAGAAAG TTATGGACTG GACGACCTTT ATAGG GACAG 7320 

50 

TAGCTGTACT TCTTTTTGCA GTTATACCTA TGATGGCTTT TCCAAAAGCA AGTGAAGATA 73 80 

TCATCACTGG TATTAATAGT GCCATTTCTG ATTCAATTGG TTCGATATAT TTATTTATGG 744 0 

55 
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TTGGTAAAGC AAGTGATAAA CCAGAATTTA ATACATTTAC ATGGGCGGCA ATGCTGTTTT 7 56 0 

GTGCAGGCAT AGGCTCTGAT ATTTTATACT GGGGCGTTAT TGAATGGGCT TTTTAC TATC 76 2 0 

AAGTTCCACC AAATGGCGCG AAAAG TATGA GTGATGAAGC ACTCCAATAT GCGACGCAAT 76 80 

ATGGTATGTT CCACTGGGGG C CAATTG CTT GGGCTATTTA TGTTCTACCA GCATTACCAA 7 74 0 

TTGGTTATTT AGTATTTGTT AAAAAACAAC CGGTGTATAA AATTAGTCAA GCTTGTCGTC 7 8 00 

CGATTTTAAA AGGTCAAACA GATAAATTTG TAGGTAAAGT TGTAGATATC TTATTTATCT 7 86 0 

TTGGATTGCT AGGTGGTGCG GCAACATCAC TAGCGTTAGG TGTGCCATTA ATTTCTGCAG 7 92 0 

GCATAGAAAG ATT AACTGG T TTAGATGGTA AAAATATGAT TTTACGTTCG GCCATTTTAT 798 0 

TAACAATCAC GGTTATATTT GCCATTAGTT CATATACAGG ATTGAAAAAA GGTATTCAAA 804 0 

AGTTAAGTGA TATCAACGTT TGGCTATCCT TTGTACTTTT AGCCTTTATA TTTATTATTG 8100 

GACCGACTGT TTTTATTATG GAAACGACAG TGACAGGGTT CGGAAATATG TTGAGAGATT 8160 

TCTTTCATAT GGCAACATGG TTAGAACCAT TCGGTGGTAT TAAAGGTCGA AAAGAAACGA 822 0 

ATTTCCCACA AGACTGGACA ATATTCTACT GGTCATGGTG GTTAGTATAT GCGCCATTTA 82 80 

TCGGTTTATT TATCGCTAGA ATTTCAAAAG GTCGACGCCT TAAAGAAGTC GTGCTAGGAA 834 0 

CAATTATTTA TGGAACGCTT GGATGCGTAT TATTCTTTGG TATTTTTGGT AACTATGCTG 84 0 0 

TGTATTTACA AATTTCTGGA CAGTTTAATG TAACACAATA TTTAAATACA CATGGTACAG 846 0 

AGGCAACCAT TATTGAAGTG GTGCATCATT TACCATTCCC ATCATTGATG ATTGTACTAT 8520 

TCTTAGTATC TGCTTTCTTA TTCTTAGCAA CAACATTTGA TTCGGGTTCA TATATTTTAG 85 80 

CGGCAGCATC TCAGAAAAAA GTGGTAGGCG AACCATTACG TGCCAATCGT TTATTCTGGG 864 0 

CATTTGCATT GTGCTTATTG CCATTTTCAT TGATGCTAGT TGGTGGTGAA CGTGCATTAG 8700 

AAGTATTGAA AACTGCTTCA ATACTGGCAA GTGTGCCATT AATTGTTATT TTTATTTTCA 8760 

TGATGATATC ATTTTTAATC ATTTTAGGGC GCGATAGAAT TAAACTTGAA ACGCGTGCTG 8820 

AAAAATTAAA AGAAGTTGAA CGTCGTTCAT TGCGAATCGT TCAAGTATC a GAAGAAGAAC 8880 

AAGACGATAA TTTATAATTC AAAGCGGGTC TGGGACGACG AAATGaATTT TGTGAAAATA 8 94 0 

TCATTTCTGT TCCaTTCCCC TTTTTTTAGT AGCATTGTAG GATGAACTTT TAGGTTTTCA 9000 

TTAATGTTGT ACTAAAAGAT TTAATTTTTT AGTGCTCCAA GTACTTATTT ATTGTATGAA 9060 

GCATATTCTA AATCGAAGTT TGAAAGACTC TCATTGATTA TTAAATTAAA T AAAGG GTAT 912 0 

GCGTATGTAC AATTCAAATT AATCGAAGGA TGAAATAAAA TGACTAATCA ATTTAAAAAT 918 0 

AAACAGTCCA AATTACATGA CAGTTTAGAA TCCATCACAA AAAACTTATA TGCGACACCT 924 0 
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ACAGAATATT GTTATCTATC ATTCCGGACA CTTAGGTGAC TCCCAACAAG ACATTGCATC 93 60 

ATTAGGTGGT GTTTCAAAAG TATTGATGAA TCATGATCAT GAATCTATAG GAGGTTCTAA 94 2 0 

5 

TCAAGTTGAA GCCCCTTACT TTATACATGA AAATGATGTG GCTGCACTGA AACATAAGAT 94 80 

TTCTGTTCAA AAACAATTTA GTAATCGTGT AATGTTGGAT AAGGATTTAG AAGTTATTCC 9 54 0 

CGCGCCTGGA CATACACCAG GGACGACACT ATTTTTATGG GATGATGGTC ATCACCGTTA 9600 

10 

CTTATTTACT GGAGATTTTA TATGTTTTGA AGGGAAGAGA TGGCGTACAG TTATATTAGG 9660 

TTCAAGTGAT AGAGAAAAAT CTATTCAAAG TTTAGAGATG GTTAAAGAAT TAGATTTTGA 9720 

, 5 TGTACTTGTA CCTTGGGTTA CTATCAAAGA TGAACCGTTA GTTTATTTTG TAGAAAATGA 97 8 0 

ATATGAAAAA CGTGAACAAA TACAAAATAT TATTGATAGA GTACGTGAGG GCGAGAATAG 984 0 

CTAATTGAAA TATATTGGCG AAg CAATGTA ACGAATCTAA GAAAGCCCTA GAAAATACCT 9 900 

20 CCATAATTGA TTGTCATATA AAACAAAAAC GGTAATTTCT ATTTATTGAG ATAGAAATTA 996 0 

CCGTTTATTT CGTGGACCTA TTGCATTGTT TTTATCATGC ATAATCATCA TTGTCGTTGT 1002 0 

TTGAGTCAAT TTTAATTTTC AGAATCAGAA GGCTGTTCTG GAATTGGGAA ATATTTGAAA 10080 

25 ATTTCACCGC TTTCAATCGC TTCGGTTAAC TGTTCTAACC ATTCGTAATA AACATGTGTA 1014 0 

TGATCAAGCT GAGCTTTAAT TTTTTGTGCC TCTTGTGTTT CAGCTTCAGT TAAATCACTG 10200 

CTTTCAAGTA ATGGATTGAT AATAGCTTGA GCATCTTTTA CTGCTTCGAC ATTGATGTCA 10260 

30 

ATTTCACGCT GGAATTTTTT AGTGAAAAAG TTTCGGAAAA AGATGAAAAA GTCTTTCTCG 10320 

GCGATAAAAT GTTGTTTGCG GCTTCCTCTC GTAAATTGTT GTTTAACAAT ATCAAATTCC 10380 

35 TGCAATTTCT TAACGCCAGC ACTCATACTT GGTTTGCTCA TTTGCAATTG ATGACGCATT 10440 

TCATCAAG CG TCATACTGCC TTCAAACACC ATTGTGCCAT ATAAGTTTCC TACACTTCTA 1050 0 

TTAGTGCCAT ACAAATCCAT TGTCTGTCCA ATTGAATTAA TTACAATATC TTTTGCTTGT 10560 

40 TCTAATTGTT GCTGTTTGTT CTGAGAACGA GTCATCATTG CACCTCCGTA CATCATTTTG 1062 0 

GTCACGTTAA AATAAATACT AATA CATT AT AAAACCTTTT CTAAAAAAAG ACATTAAAAA 10680 

TATTTAAAGC ATTAAAGTTA AATGTTTCGT TAAATAAAAA TCTAACGAAC TTACAAAACT 10740 

45 TAATTCTTGA GTTGTTTTGT AAATTGACAC ATTTTTCATT TCTATGCTAA CATAAGTnTG 108 00 

TAAAATTcGT TAAATAAAAA TTTAACAAAC TTAACGGrGG TTGTTGAAkG GrACTTTTAA 10860 

aACATTTATC TCAGCGTCAA TATATTGATG GTGAGTGGGT TGAAAGCGCG AATAAAAATA 10 920 

50 

CAAGAGATAT TATCAATCCT TACAATCAAG AAGTGATATT TACGGTTTCT GAAGGGACAA 10 980 

AAGAGGATGC AGAACGTGCA ATCTTAG CTG CAAGACGTGC GTTTGAGTCT GGTGAATGGT 11040 

55 
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AACATCgCGA AgCgTTAGCA CGATTAGAAA CATTAGATAC TGGAAAAACG TTAGAAGAAT 1116 0 

CATATGCAGA TATGGATGAT ATT CATAATG TGTTTATGTA TTTTGCTGGA TT AG CAG ATA 11220 

AAGACGGTGG CGAAATGATT GATTCACCAA TTCCAGATAC AGAAAGCAAA ATTGTTAAAG 112 8 0 

AACCAGTAGG TGTAGTTACA CAAATTACAC CTTGGAATTA TCCGTTATTA CAAG CAT CAT 11340 

GGAAAATTGC GCCAGCGCTT GCTACGGGTT GTTCACTAGT TATGAAACCA AG TG AAATTA 11400 

CACCATTAAC AACAATACGT GTTTTTGAAT TAATGGAAGA AGTTGGTTTC CCTAAAGGAA 114 60 

CAATTAATCT TATTCTAGGT GCAGGTTCTG AAGTTGGTGA CGTAATGTCA GGTCATAAAG 11520 

AGGTTGACCT TGTATCATTT ACAGGTGGCA TTGAGACTGG TAAGCATATT ATGAAAAATG 11580 

CTGCTAATAA TGTTACGAAT ATTGCCTTGG AACTTGGCGG TAAAAATCCA AACATTATCT 11640 

TTGATGATGC TGATTTTGAA TTGG CAGTAG ACCAAGCGTT AAATGGTGGA TATTTCCATG 11700 

CAGGTCAAGT TTGTTCAGCA GG AT CAAG AA TATTAGTACA AAACAGTATT AAAGACAAAT 11760 

TTGAGCAAGC ACTTATTGAT CGCGTGAAAA AAATCAAATT AGGTAATGGT TTTGATGCTG 11820 

ATACTGAAAT GGGACCAGTG ATTTCAACAG AACATCGTAA TAAGATCGAA TCTTATATGG 11880 

ATGTAGcTAA AGCAGAAGGC GCAACAATTG CTGTTGGTGG TAAACGTCCA GATAGAGATG 11940 

ATTTAAAAGA TGGTCTATTC TTCGAGCCAA CAGTCATTAC AAATTGTGAT ACGTCAATGC 12 000 

GTATTGTACA AGAAGAGGTT TTCGGACCTG TCGTTACTGT AGAAGGCTTT GAAACTGAAC 12060 

AAGAAGCGAT TCAATTAGCG AATGATTCTA TATATGGTTT AGCAGGTGCT GTATTTTCTA 1212 0 

AAGATATTGG AAAAGCACAA CGCGTTGCTA ACAAGTTGAA ACTTGGAAC G GTGTGGATTA 12180 

ATGATTTCCA TCCATATTTT GCACAAGCGC CATGGGGTGG ATACAAACAA TCAGGTATCG 122 4 0 

GTAGAGAATT AGGCAAAGAA GG CTTAGAAG AGTAC CTTGT TTCAAAACAC ATTTTAACAA 12 3 00 

ATACAAATCC ACAATTAGTG AATTGGTTTA GCAAATAAAA ATTAGATAAG GTGAGTGCCA 123 60 

TTGTAAGAAC ACAAGACACT CACTTTGTTT TGTATAAGTG GCGAAATGTT GATTGATAAT 124 20 

TTGGACTAAA CGCAAAATGA AT CATAGATT ATTTCATTAC TGTTAGTAAC AATCGTAAAA 12480 

GGAAAAGCGA GTGTTTTGGT TAG CTAAGTT TAGCAATTCA ACGATAACCA ATCAGCCACT 12 54 0 

AACAAATATT TCATGCAATA CTCACTTTGA AATACAACAA ACTTTGGAGG TCATAACGAT 126 00 

GAGTAA C AAA AACAAATCAT ATGATTATGT CATCATTGGA GGAGGCAGTG CAGGTTCTGT 126 60 

ACTAGGTAAT CGTCTGAGTG AAGATAAAGA TAAAGAAGTC TTAGTATTAG AAGCGGGTCG 127 2 0 

CAGTGATTAT TTTTGGGATT TATTTATCCA AATGC CTGCT GCGTTAATGT TCCCTTCAGG 127 8 0 

CAATAAATTT TACGATTGGA TTTATTCAAC AGATGAAGAA CCACATATGG GCGGTCGTAA 12 840 
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TCAACGTGGT AATCCAATGG ACTATGAAGG CTGGGCAGAA CCAGAAGGTA TGGAAACTTG 12 960 

GGATTTTGCG CACTGTTTAC CGTATTTTAA AAAATTAGAA AAAACATACG GTGCAGCGCC 13 020 

TTATGATAAA TTTAGAGGCC ATGATGGACC AATTAAGTTA AAACGAGGGC CAGCAACGAA 13 080 

TCCTTTATTC CAGTCATTCT TTGATGCAGG TGTTGAAGCA GGCTATCATA AAACACCTGA 1314 0 

TGTGAATGGA TTTAGACAAG AAGGTTTTGG ACCGTTCGAT AGTCAAGTAC ATCGTGGTCG 13 200 

CCGAATGTCA GCTTCAAGAG CATATTTACA TCCAGCGATG AAGCGTAAAA ACTTAAC CGT 13260 

TGAAACACGT GCCTTTGTAA CTGAAATTCA TTATGAAGGT AGAAG AG CAA CTGGTGTTAC 13 320 

GTATAAGAAA AATGGCAAAC TACATACCAT CGATGCTAAT GAAGTCATTT TGTCTGGTGG 13 3 80 

GGCATTCAAT ACGCCACAAT TACTACAATT ATCTGGTATC GGTGATTCAG AGTTC CT AAA 13 44 0 

ATCAAAAGGC ATTGAGCCAC GTGTTCATTT ACCTGGTGTG GGTGAAAACT TTGAAGATCA 13 500 

CTTAGAGG 13 508 
(2) INFORMATION FOR SEQ ID NO: 121: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 764 6 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 121: 

GTAAGTATTG TCTTGATTTC CTAATAAAGT TATATCTTGT AATTCATCTT GTTGACGGCC 6 0 

ATGTGCCATA TAAAGCGCTC CTTTAAATTT ATTTTTTTAT TATTTTGGCG TCTCGGCGTG 12 0 

CTTTTTCAAA CATGTAATAA CTTGCACCGA TAATAACGAC GTAACCTAAT GTTG CATAGA 180 

AATCTGGAGA TTCTCCGAAT AGAATAAATC CAAG TATTGC TGTGAAAATT ATAG ATG CAT 24 0 

ACGTAAAAAT AGAAATATCT TTTGCTGCTG CAAAACTATA TGCTAAAGTA ACACCAATTT 3 00 

GACCCACAGC GGCAgCTAAG CCAGCCCCTA ATAGATAAAG TATTTGCATC TGACTCATTG 3 60 

GTTCATAAGT ATATGCAGTG AAAGGTATTA AAACGATGAC AGAAAATAAG GAGAAGTAAA 42 0 

ATACTATAGT ATATGGTGCT TyTCTTGTAC TAAGTGCTCG AACACATGTA TATGCTGATG 4 80 

CTGCAAAAAT ACCTGAGAAT AAGCCAGCTA ATGATGGAAT CATAGATGAT GAAAATTCAG 54 0 

GTTTCACTAT TAAnAGCAaC CTAAAATAGC AATTATCATT GCTGTAATTT GaTACTTCCT 600 

TACCTTTTCA TGtAAGAaaA CAATGCTTaA TAAAATCGTC CAGAAAGGAT TGAGTTTCAT 660 

TAATGAATCG GCATCACTAA GTACCATATG ATCAATGGCA TAAATATTTA ACAATACACC 72 0 
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TGGCTGATGG TATTTATATA TAAAAAATAA TGGAATAAAC ATTG CTACT A AGTTTC GTGC 84 0 

TAATGATTTT TGAAAAACAG GAAGGTCACC TGCAAGTCTG AAAAACACTG ACATAAAACT 90 0 

5 

GAAACCAATA GCCGAAATTA AAATGGCAAT GATACCTTTT ACTTTAGGAT TCAATTTTAT 96 0 

CGCCTCTTTT ATATAAAATT AACGTATTTA TATTAGCATA AAACAACATG TTGTGCATAA 102 0 

^ ATAGTTGAAA TTTACTATAA AAAGACTATA ATAGACTGTA GCGAACAAAC GTTCTGTGTT 1080 

TATTTGTCGG AATAATAGGG CATTACACTT TTATGAATGT TTGTGTTATT ACATAAAACA 114 0 

AATATCAATT CAGTATCAAG CTAATAAGCT TTTTCTTGAT TTCTGTTGAT ACAATTGAGA 1200 

r5 TTGACACAGA TTTAAAAAAA TCAAGTGATA TCTACTAAAA AATTTTTTTA AATTTGTTCA 1260 

AGTTTTTCTA ATTTAGTATT GGTGCCTAGT TGGAACGTTT TACGAACATT CGATTAGAAA 1320 

ATGGCACTTT AAATCATAGT GTGTCTTATG TATAATGAAA CACATAATAT AGTGTTGGTG 13 80 

20 AAACGAAAAA gACACAATAT CTTGTGTTTT GTATGCAAAT GCTTTATTTA TGAAGAAATT 144 0 

ACATTTAAAA GTAATTTAAC ACAGAAATTT AATAGTTATT ATCAATTAAT AGTCATATTT 1500 

TTAGAAAATG TACTGAGCAA ATGGAAGATA TCCAATGATG TAAACACTAC ATATAGTGAT 156 0 

25 

TTTTATACAT TCAACCCATA TAAGCTACTA TTTTCTCAAA TATAAATCTA TGCAATTGGT 162 0 

TTACATTTGA GAAAATAAGT AG CTTCATTA TAG TTAATAC AATGCTGAGA TAACCATAGT 16 80 

AACCATGTTG TTAAAGCATT TTTTAATTGG AATGACTACT TTATTTAAAA GGGTTGAAGA 174 0 

30 

AAGAAGGTGA TCCAATGAAA ATAATATATT TTTCATTTAC TGGAAATGTC CGTCGTTTTA 1800 

TTAAGAGAAC AGAACTTGAA AATACGCTTG AGATTACAGC AGAAAATTGT ATGGAACCAG 186 0 

35 TTCATGAACC GTTTATTATC GTTACTGGCA CTATTGGATT TGGAGAAGTA CCAGAACCCG 192 0 

TTCAATCTTT TTTAGAAGTT AATCATCAAT ACATCAGAGG TGTGGCAGCT AGCGGTAATC 19 8 0 

GAAATTGGGG ACTAAATTTC GCAAAAGCGG GTCGCACGAT ATCAGAAGAG TATAATGTCC 2 04 0 

40 CTTTATTAAT GAAGTTTGAG TTACATGGAA AAAACAAAGA CGTTATTGAA TTTAAGAACA 2100 

AGGTGGGTAA TTTTAATGAA AACCATGGAA GAGAAAAAGT ACAATCATAT TGAATTAAAT 2160 

AATGAGGTCA CTAAACGAaG AGAAGATGGA TTCTTTAGTT TAGAAAAAGA CCAAGAAGCT 22 2 0 

45 TTAGTAGCTT ATTTAGAAGA AGTAAAAGAC AAAACAATCT TCTTCGACAC TGAAATCGAG 2 2 80 

CGTTTACGTT ATTTAGTAGA CAACGATTTT TATTTCAATG TGTTTGATAT TTATAGTGAA 2340 

GCGGATCTAA TTGAAATCAC TGATTATGCA AAATCAATCC CGTTTAATTT TGCAAGTTAT 24 0 0 

50 

ATGTCAGCTA GTAAATTTTT CAAAGATTAC GCTTTGAAAA CAAATGATAA AAGTCAATAC 24 60 

TTAGAAGACT ATAATCAACA CGTTGCCATT GTTG CTTT AT ACCTAGCAAA TGGTAATAAA 252 0 

55 
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ACATTTTTAA ACGCAGGCCG TGCGCGTCGT GGTGAGCTAG TGTCATGTTT CTTATTAGAA 26 4 0 

GTGGATGACA GCTTAAATTC AATTAACTTT ATTGATT CAA CTGCAAAACA ATTAAG TAAA 270 0 

s 

ATTGGGGGCG GCGTTGCAAT TAACTTATCT AAATTGCGTG CACGTGGTGA AG CAATTAAA 276 0 

GGAATTAAAG GCGTAgCGAA AGGCGTTTTA CCTATTGCTA AGTCACTTGA AGGTGGCTTT 2 820 

AGCTATGCAG ATCAACTTGG TCAACGCCCT GGTGCTGGTG CTGTGTACTT AAATATCTTC 2 88 0 

CATTATGATG TAGAAGAATT TTTAGATACT AAAAAAGTAA ATG GGGATG A AGATTTACGT 2 94 0 

TTATCTACAA TATCAACTGG TTTAATTGTT CCATCTAAAT TCTTCGATTT AG CTAAAG AA 3 000 

1S GGTAAGGACT TTTATATGTT TGCACCTCAT ACAGTTAAAG AAGAATATGG TGTGACATTA 3 06 0 

GACGATATCG ATTTAGAAAA ATATTATGAT GACATGGTTG CAAACCCAAA TGTTGAGAAA 312 0 

AAGAAAAAGA ATGCGCGTGA AATGTTGAAT TTAATTGCGC AAACACAATT ACAATCAGGT 3180 

20 TATCCATATT TAATGTTTAA AGATAATGCT AACAGAGTGC ATCCGAATTC AAACATTGGA 324 0 

CAAATTAAAA TGAGTAACTT ATGTACGGAA ATTTTCCAAC TACAAGAAAC TT CAATT ATT 3300 

AATGACTATG GTATTGAAGA CGAAATTAAA CGTGATATTT CTTGTAACTT GGGCTCATTA 3360 

2b AATATTGTTA ATGTAATGGA AAGCGGAAAA TTCAGAGATT CAGTTCACTC TGGTATGGAC 34 2 0 

GCATTAAGTG TTGTGAGTGA TGTAGCAAAT ATTCAAAATG CACCAGGAGT TAGAAAAGCT 34 8 0 

AACAGTGAAT TACATTCAGT TGGTCTTGGT GTGATGAATT TACACGGTTA CCTAGCAAAA 3 54 0 

30 

AATAAAATTG GTTATGAGTC AGAAGAAGCA AAAGATTTTG CAAATATCTT CTTTATGATG 360 0 

ATGAATTTCT ACT CAATCGA ACGTTCAATG GAAATCG CTA AAGAGCGTGG TATCAAATAT 3 66 0 

CAAGACTTTG AAAAGTCTGA TTATG CTAAT GGCAAATATT TCGAGTTCTA TACAACTCAA 3 72 0 

3S 

GAATTTGAAC CTCAATTCGA AAAAGTACGT GAATTATTCG ATGGTATGGC TATTCCTACT 3 78 0 

TCTGAGGATT GGAAGAAACT ACAACAAGAT GTTGAACAAT ATGGTTTATA TCATGCATAT 3 84 0 

40 AGATTAGCAA TTGCTCCAAC ACAAAGTATT TCTTATGTTC AAAATGCAAC AAGTTCTGTA 3 900 

ATGCCAATCG TTGACCAAAT TGAACGTCGT ACTTATGGTA ATGCGGAAAC ATTTTACCCT 3 960 

ATGCCATTCT TATCACCACA AACAATGTGG TACTACAAAT CAGCATTCAA TACTGAT CAG 4 02 0 

45 ATGAAATTAA TCGATTTAAT TGCGACAATT CAAACGCATA TTGACCAAGG TATCTCAACG 4 08 0 

ATCCTTTATG TTAATTCTGA AATTTCTACA CGTGAGTTAG CAAGATTATA TGTATATGCG 414 0 

CACTATAAAG GATTAAAATC ACTTTACTAT ACTAGAAATA AATTATTAAG TGTAGAAGAA 4 200 

50 

TGTACAAGTT GTTCTATCTA ACAATTAAAT GTTGAAAATG ACAAACAGCT AATCATCTGG 4 26 0 

TCTGAATTAG CAGATGATTA GACTGCTATG TCTGTATTTG TCAATTATTG AGTAACATTA 4 320 

55 
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ATGTTTTGGA 


GACAAAATAT 


ATCTCAAATG 


TGGGTTGAAA 


CAGAATTTAA 


AGTATCAAAA 


4440 


GACATTGCAA 


GTTGGAAGAC 


TTTATCTGAA 


GCTGAACAAG 


ACACATTTAA 


AAAAGCATTA 


4500 


GCTGGTTTAA 


CAGGCTTAGA 


TACACATCAA 


GCAGATGATG 


GCATGCCTTT 


AGTTATGCTA 


4560 


CATACGACTG 


ACTTAAGGAA 


AAAAGCAGTT 


TATTCATTTA 


TGGCGATGAT 


GGAGCAAATA 


4620 


CACGCGAAAA 


GCTATTCACA 


TATTTTCACA ACACTATTAC 


CATCTAG TGA 


AaCAAACTAC 


4680 


CTATTAGATG 


AATGGGTTTT 


AGAGGAACCC 


CATTTAAAAT 


ATAAATCTGA 


TAAAATTGTT 


4740 


GCTAATTATC 


ACAAACTTTG 


GGGTAAAGAA 


GCTTCGATAT 


ACGACCAATA 


TATGGCCAGA 


4800 


GTTACGAGTG 


TATTTTTAGA 


AACATTCTTA 


TTCTTCTCAG 


GTTTCTATTA 


TCCACTATAT 


4860 


CTTGCTGGTC 


AAGGGAAAAT 


GACGACATCA 


GGTGAAATCA 


TTCGTAAAAT 


TCTTTTAGAT 


4920 


GAATCTATTC 


ATGGTGTATT 


T AC CGGTTTA 


GATGGACAGC 


ATTTACGAAA 


TGAACTATCT 


4980 


GAAAGTGAGA 


AACAAAAAGC 


AGATCAAGAA 


ATGTATAAAT 


TGCTAAATGA 


CTTGTATTTA 


5040 


AATGAAGAGT 


CATACACAAA 


AATGTTATAC 


GATGATCTTG 


GAATCACTGA 


AG ATGTG CTA 


5100 


AACTATGTTA 


AATATAATGG 


AAACAAAGCA 


CTTTCAAACT 


TAGGCTTTGa 


ACCTTATTTT 


5160 


GAGGAACGTG 


AATTTAACCC 


AATCATTGAG 


AATGCCTTAG 


ATACAACAAC 


TAAAAACCAT 


5220 


GACTTCTTCT 


CAGTAAAAGG 


TGATGGTTAT 


GTATTAG CAT 


TAAACGTAGA 


AGCATTACAA 


5280 


GATGATGACT 


TTGTATTTGA 


CAACAAATAA 


CAATTAAATT 


AAAAGACCTT 


CACATGTAAA 


5340 


GGGAAATAGC 


GATTCGTTTC 


GTCTTGTCTC 


CTACATGTTG 


AAGGTCTTTT 


TTTATGTGTA 


5400 


TCTAACTCAT 


TATGAGTCTG 


AGTAAGAAAT 


CAATGCTCTA 


AGATGTACAA 


TGCTATTTAT 


5460 


ATTGGCAGTA 


GTTGGCGGGG 


CCCCAACACA 


GAAGCAGGCG 


GAAAGTCAGC 


TAACAATATT 


5520 


GTGCAAGTTG 


GCGGGGCCCC 


AACATAGAAG 


CAGGCGGAAA 


GTCAGCTAAC 


AATAATGTGC 


55B0 


AAGTTGGCGG 


GGCCCCAACA 


TAAAAG CAGG 


CGGAAAGTCA 


GCTAACAATA 


TTGTGCAAGT 


5640 


TCGGgCGGGG CCCCAACATA AAGAAAAACT TTTTCCTTTA GAAATTATCA 


CTTCCaCaTG 


5700 


AGTTTTACTC 


ATGTATTCCT 


ATTTTTAAGT 


ACACATTAGC 


TGAGGCTAAT 


GTTAAGAACC 


5760 


ACTACTTAAT 


CAATCATTAG 


TAGTTTTTAT 


CATTTCCACT 


ATTCCCaGAC 


ATCaAAATCT 


5820 


TAAGTGTTCT 


ATTTTACTTT 


AAGTAAACAA 


AATACACATT 


CCGAAAAATT 


AAATTTCAGT 


5880 


TTAATTGCAA 


ATATCAATAA 


AATTGACACT 


AAATTATTTG 


AAAGGCTATT 


GAAATT ATG G 


5940 


TCAAAAAACG 


CTACTATTAA 


TGAGAAATAT 


TATCAATGAT 


AATGATTATC 


ATTAATTTAA 


6000 


AGGGAGAAAA 


ATTTGTAATG 


AAGTATTTAT 


TAAAGGGAAA 


TATTTTGCTT 


CTATTACTAA 


6060 


TATTGTTGAC 


AATTATTTCG 


TTGTTCATAG 


GTGTGAGTGA 


ACTATCAATT 


AAAGATTTAC 


6120 
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GTATTTTAAT TGCTGGAAGT TCGTTGGCTT TAGCAGGCTT GATAATGCAA CAAATGATGC 624 0 

AAAATAAGTT TGTTAGTCCG ACTACAGCTG GAACGATGGA ATGGG CTAAA CTAGGTATTT 63 0 0 

5 

TAATTGCTTT ATTGTTCTTT CCAACCGGTC ATATTTTATT AAAACTAGTA TTTGCTGTTA 636 0 

TTTGCAGTAT TTGCGGTACG TTTTTATTTG TTAAAATCAT TGATTTTATA AAAGTGAAAG 64 2 0 

ATG TCATTTT TGTACCGCTT TTAGGAATTA TGATGGGTGG GATTGTTGCA AGTTcACAAC 64 8 0 

10 

CTTCATCTCA TTGCGCACGA ATGCTGTTCA AAGCATTGGT AACTGGCTTA ACGGGAACTT 6 54 0 

TGCCATTATC ACAAGTGGAC GCTATGAAAT TTTATATTTA AGTATTCCTC TTTTAG CATT 660 0 

, s GACATATCTT TTTGCTAATC ATTTCACGAT TGTAGGAATG GGTAAAGACT TTACTAATAA 6 66 0 

TTTAGGTTTG AGTTACGAAA AATTAATTAA CATCGCATTG TTTATTACTG CAACTATTAC 6 72 0 

AGCATTGGTA GTGGTGACTG TTGGAACATT ACCGTTCTTA GGACTAGTAA TACCAAATAT 67 8 0 

20 TATTTCAATT TATCGAGGTG ATCATTTGAA AAATG CTATC C CTCATACG A TGATGTTAGG 684 0 

TGCCATCTTT GTATTATTTT CTGATATAGT TGG CAGAATT GTTGTTTATC CATATGAAAT 6 900 

AAATATTGGT TTAACAATAG GTGTATTTGG AACAATCATT TTCCTTATCT TGCTTATGAA 6 96 0 

25 AGGTAGGAAA AATTATG CGC aACAATAATA AAAAAATAAT GCTTTTAATT GCAGTAACGT 702 0 

TATTAATTAG TATGCTGTAC TTATTTGTAG GTATTGATTT TGAAATATTT GAATATCAAT 70 8 0 

TTTCAAGTCG TTTAAGAAAG TTCATATTAA TTATTTTAGT AGGTGCTGCC ATTGCAACTT 714 0 

30 

CAGTGGTGAT TTTTCAAGCG ATTACAAATA ACCGTCTATT GACAC CATCA ATAATGGGGT 720 0 

TAGATGCAGT TTATTTATTT ATCAAAGTAT TGCCAGTCTT TTTATTTGGA ATTCAATCGG 726 0 

3s TATGGGTTAC TAATGTATAT TTGAACTTTA TATTAACACT TATAACGATG GTGTTATTCG 732 0 

CACTAATCCT ATTCCAAGGT AT CTTTAAAA TCGGACATTT TTCAATTTAT TTTATCTTAC 73 8 0 

TTATTGGTGT CCTTTTAGGA ACATTTTTTA GAAGCATAAC AGGTTTTATT CAACTGATTA 744 0 

40 TGGATCCTGA GTCATTTTTA GCAATACAAA GTAGTATGTT TGCTAATTTT AATGCTTCTA 7500 

ATTCGAATTT AGTTACTTTC TCAGCAGTGC T ATT AG TAAT CTTATTAGTC ATTACAATTT 756 0 

TACTATTGCC TTATTTAGAT GTATTGCTTT TAGGTCGTGC TGAAG CAATT AATCTTGGGA 762 0 

45 TATCGTATGA AAAATTAACG CGAATT 7 64 6 

(2) INFORMATION FOR SEQ ID NO: 122: 

(i) SEQUENCE CHARACTERISTICS: 
50 (A) LENGTH: 1194 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 122: 

ATGAATATAT TTnnAAATAA ATTATTATGG ATTGCACCAA TnG CCACTAT GATTATCTTG 6 0 

5 GTAATCTTTT CTTTAGCTTT TTATCCTGCA TATAATCCTA AACCAAAAGA TTTACCAATT 12 0 

GGTATATTAA ACGAGGATAA AGGTACAACG ATTCAAGATA AAAATGTTAA CATTGGTAAA 180 

AAATTAGAGG ATAAATTATT AGATAGTGAT TCTAATAAAA TTAAATGGGT TAAGGTTGAT 24 0 

10 

AGTGAAAAAG AC CTTG AAAA AGATTTGAAA GATCAAAAAA TCTTTGG AG T AG CT ATTATT 300 

GATAAAGACT TTTCAAAAGA TGCTATGAGT AAAACACAAA AAGTAGTTAT GGATAGTAAA 360 

IS AAAGAAGAAA TGCAACAAAA AGTTGCTTCA GGTGAAATTC CGCCACAAGT GGTTCAACAA 42 0 

ATGAAACAAA AAATGGGGAA TCAACAAGTA GAGGTTAAGC AGGCTAAATT TAAAACGATT 4 80 

GTAAGTGAAG GATCAAGCTT ACAAGGTTCA CAAATTGCAT CAGCTGTGTT AACTGGTATG 540 

20 GGTGATAATA TTAATGCTCA AATTACGAAG CAAAGTTTGG AAACATTAAC GAGTCAAAAT 600 

GTTAAAGTCA ATGCCGCGGA CATCAATGGT TTGAC GAATC CAGTAAAAGT GGATAATGAA 660 

AAACTTAATA AAGTTAAAGA TCACCAAGCA GGTGGTAATG CACCATTCCT AATGTTTATG 72 0 

25 CCAATTTGGA TAGGTTCAAT CGTAACGTCT ATCTTATTGT TCTTTGCATT TAGAACTAGT 78 0 

AACAATATCG TCGTGCAACA TCGTATCaTT GCtTCAATTG GACAGATGAT ATTTGCAGTT 84 0 

GTTGCAGCAT TTGCAGGTAG CTTTGTTTAT ATTTATTTCA TGCAAGGCGT TCAAAGATTT 90 0 

30 

GATTTTGACC ATCCAAATCG TATCGCAATT TTTGTAGCAT TTGCGATTCT TGGTTTCGTG 960 

GGCCTTATTT TAGGTGTTAT GGTATGGCTA GGTATGAAGT CAGTTCCAAT TTTCTTCATT 102 0 

TTAATGTTCT TTAGTATGCA ACTTGTAACG TTACCTAAAC AAATGTTGCC TGAAAGTTAT 108 0 

35 

CAAAAATATG TATATGATTG GAATCCATTC ACACACTATG CAACAAGTGT AAGAGA C TAT 114 0 

TATACTTGAA TCATCATATT GAATTAAATA GTACAATGTG GATGTTTATA GGGT 1194 
4Q (2) INFORMATION FOR SEQ ID NO: 123: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 558 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
« (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 123: 

50 GACCGACCTA TACATCCGTA TAAGTATTTC TTGATATAAG TCTTCTAAAT CATAATGATT 6 0 

AAATCCAAAT GTTTTGATGC GTCGAATAAT TAATGGTTGT AGATCCATTA CTAACTTTTC 120 
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GTATTTCAAA TATTAAACTA ACCCCTTCTA TCTAAAATTT AAGGTTAGTT TAATATTGTT 24 0 

ACATTCAAAA TTTCAAGATG ACGGAAATGT CATTTCTTAT GATGTCCTCT TCGTATTTTT 3 00 

TCAAATTCTG CAAGGATTTC AGAAGATAAC GGAATTCGAG TTCTTGGCTT GTTTTCACTT 3 60 

ATATCATCTA ATGATTTACT CACATCAATT TCATTTTCTT TTAAATCTCT CCACATTTCG 42 0 

CGAGATGATA TTCTATATGC ACCTGATCCA AAGATAGCAT GTTGcTCACT CaTATCACTT 4 80 

GTTACAACTG TAATATGcTT AGtATGCTTG tCaTAAAGtT CaTAAACCAT AACGGTTCTA 54 0 

ATGGAAACCA ATCAGCTG 55 8 

(2) INFORMATION FOR SEQ ID NO: 124: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7762 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 124: 

25 GCTTCAGACA TnTGATGATA TAATCTCTCA TCATCGATTA ATTCTTTTGC AGCTTGATAC 6 0 

ACATnTTGCT TATTTGTTCC AATGACTTTT AATGTGCCAG CTTCAACACC TTCAGGACGT 120 

TCTGTAACAC TTCGCCAAAA CTAAAACTGG CTTATTAAAT GATGGCGCTT CTTCCTGAAT 18 0 

30 TCCACCTGAA TCTGTCAAAA TAAAATAAGA TTTTnTAGCA AAATTATGGA AATCTATACG 24 0 

TCCAAAGGTT CAATCAATTC AATTCTGTCA TGACTACCTA AAATCTTTTG AGCCACCTCT 3 00 

CGAACTTTCG GGTTTTTATG CATTGGATAT ACCAGTGCTA AATCAGTATA CTCATCTATT 3 60 

35 

AAGCGTCTAA CCGCTTTAAA TATATTTTCC aTGGGTTTCC CGATATTTTC TCGTCGGTGT 420 

GCTGTCATrA GAATGAATTT kTtGTCATGG TATTTATCCA TGATGTTAGA TTTATAATTG 480 

TCATCAACTG TATATTTCAT AGCATCAATC GCAGTATTAC CAGTGACAAC AACACTTTCT 54 0 

GAATATTTCC CTTCACTTAA CAAATGCGAT GCAGCATTTT TAGTAGGTGC AAAATGTAAG 600 

TCAGCTAATA CACCAACTAA TTGTCTATTC ACCTCTTCTG GAAAAGGTGA ATATTTATCA 660 

45 TAACTTCTAA GCCCTGCTTC AACGTGTCCA ATCGGCACTT GGTTATAAAA TGCCGCTAAA 72 0 

CCACCTGCAA ATGTCGTCAT CGTATCACCA TGTACAAGTA CCATGTCTGG TTTTTCTAAT 78 0 

TGAATCACTT GTTCTAATTG AGTGATTGAT TTAGAAGTTA TCTCAGAAAG TGTCTGTCCT 84 0 

SO GATTTCATAA TATTCAAATC GTATTTTGGT TTGATTTCAA AGGTACTTAA TACTGAATCA 9 00 

AGCATTTCTC TATGCTGTGC TGTAACAACA ACAATTGGCT CGAGCATTTT TTCTTGTTCC 960 
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ATCTTTTTCA TCAAACTACT TATCTCCGAT TCTTCTATTT AGTACCAAAC AATCTATCTC 10 80 

CAGCGTCGCC TAACCCTGGT GTGATATATG CTTTGTCATT aGCTTTTCAT CAAGTGCAGC 114 0 

5 AATATAAATA TCTACATCTG GATGTGCTTC ATGCAT CTTT TCTACGCCTT CTGGTGCTGC 12 0 0 

AATTAAACAC ATGAAGCGAA TATTTTTAGC GCCACGTTTC TTCAATGAAG TAATAGCTTC 12 SO 

AATTGCTGAT GCGCCTGTTG CTAACATAGG ATCAACAACA ATGATTTGTC TTTCAGTAAT 132 0 

w ATCTTGAGGT AACTTAGCAA AATACTCTAC AGCCTTTAAT GTTTCGGGAT CTCGATATAA 1380 

ACCGATATGT CCAACTCTGG CTGCAGGTAC TAAACTTAAA ATACCATCAG TCATACCTAA 144 0 

ACCAG CTCTT AAAATTGGAA CGATAGCTAA TTTTTTACCA GCTAATCGTT TAGCCGTCAT 150 0 

15 

TTTAGTTACA GGCGTTTCAA TAT CAACATC CTGAAGCTCT AAGTCTCTAG TTACTTCATA 15 6 0 

TGCCATCAAC ATACCAACTT CGTCTACAAG TTCTCTAAAT TCTTTAGTAC CTGTATTTAC 1620 

so ATCTCTAATA TAGCTTAGTT TGTGTTGAAT TAATGGATGA TCGAAAACGT GTACTTTACT 1680 

CATAAAAATT ACTCCTATCT TTGTGTATGT TTATTGATAT AGAGGATATT CAGCTGTTAA 174 0 

TTTCGCAACG CGTTCTTTAG CTTG TTGTAA TTTTTCTTCA TCTTTACTAT TTTTCAATGC 1800 

25 TAAACTGATG ATTTTTGCAA CTTCCTCAAA AGCTTTTTCA TCAAATC CAC GCGTTGTTGC 1860 

AGCAGGTGTA CCTAAACGTA TACCACTCGT TACAAAAGGT TTTTCTTGAT CGAACGGAAT 192 0 

GGTATTTTTG TTACATGTGA TAC CAACTGA ATCTAAAGTC TCTTCAGCTT CTTTACCAGT 198 0 

30 AAGTCCTATA GACCCTTTTA CATCAACAGC TACTAAGTGA TTATCTGTAC CGCCAGAAAC 2 04 0 

AATTCTAAAT CCTTCATTAA TTAATG CTTC TGCAAGAACT TTTGCGTTTT TAACCACTTG 2100 

TTGTTGATAC GTTTTGAAAT TATTTTCTAA CGCTTCTCCA AAAGCAACTG CTTTtGCTgC 2160 

3S AATAACATGC TCAAGAGGTC CACCTTGAAT ACCAGGGAAA ATTGTTTTAT CTATGTCTTT 222 0 

TTTATATTCT TCCTTACATA AAATCATACC ACCACGtGGT CCGcGTAATG TTTTGTGTGT 22 80 

TGTAGTTGTT ACAAAATCAG CATATTCTAC TGGATTTGGA TGTAAACCTG CCGCTACTAA 234 0 

TCCTGCAATA TGTGCCATGT CTACCATTAA CTTAGCGTTT ACTTCATCTG CGATTTCTTT 24 00 

AAACTTTTTG AAGTCAATTG TTCTTGAATA TGCTGATGCT CCTGCCACAA TAAGCTTAGG 24 60 

45 CTTATGCTCT AACG CTAATT TACGAACTTC ATCATAATTG ATTCGTTCTG TGTCTTTATC 2 52 0 

TACTCCATAT TCAACGAAAT TGTAGAATTT ACCACTAAAA TTAACAGGCG CTCCATGTGT 2 5 80 

CAAGTG AC CA CCATGACTCA AATTCATACC TAAAACTGTG TCGCCCATTT CTAATGCAAC 264 0 

50 TAAGTAAACA GCCATGTTCG CTTGTGAACC TGAATGTGGT TGAACATTGA CATGTTCAGC 27 00 

TCCAAACAAT GCTTTAGCAC GATCAATTGC GATGCTTTCA GTAACATCTA CAAACTCACA 276 0 
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TTGTGCTTCC ATAACCGCTT CCGATACAAA ATTTTCCGAT GCGATTAACT CTATGTTGCT 2880 

ATTTTGTCTC TGAAATTCTC TCTCGATTGC TTCTGCGATA ACTTTATCTT GCTTGGTGAT 2 94 0 

5 ATAAGACATA AAATCTCCCC TTCTTTCAAA AAAACTTATT GGTATTTAGC A CGTTCGCCA 3 000 

CCAATCTTTT TCGGCCTAGA TGTGGCAATA GTTACAATTG CCTGTCCTAC TTGCTTTACT 3 060 

GAGGTCCTTA CAGGTACACA TACATGTTTA ATATGCATGC CTATTAACGT TTGACCAATA 3120 

10 

TCAATTCCAC AAGGAACAGT AATATGTTCG ACCACGATCG GATCCTTCAT ATGCTGAAAA 3180 

GCGTATGTTG CCAAACTCCC TCCAGCATGT ACATCTGGAA CGACGGAAAC TTCTTCCATT 3240 

GTTAATGGAT TATACTGAGA TTTTTCTATT GTTATCGCTC TGTTGATATG TTCACAT C CT 3 3 00 

15 

TGAAAAGCAA AAGTAACGCC TGTCTCTTTA CTCACAACAT CTAATG CATT AAAAATAGTT 33 60 

TCTGCAACTT CCaTCGAACC GACAGTCC CT ATTTTTTCGC CAATGACTTC CGATGTTGAA 3420 

2o CATCCAATTA AACATATATC TCCTTTATTA AAAAAGGACA TATCTTTTAA TTCGTCTAAT 34 80 

AACATTGTCA AATCTTTCAT AAAAGC C CAC CCTTCCTAAA AATAAAAAAG G AATAT AG CA 3 540 

AAGTG CTACA CTCCTCTATT ATAACTTATT TAACTGTTAA CATATACTAA TTATACAGAA 3 600 

2S TTCCTACTAG CAAATAATAT CTTTTAATTT TAAAATTAAA CTTACAAGTT CTTCATAGGT 3 660 

ATGTACATAC ATTT CTTTTG TTCCACCGTA TGGATCTATA ACTTCTCCTG CTTCTTTtAC 3720 

ATATTCATGC AATGTGAAAA CATGATTTTG CAAACCAAAG TGTGCCTCTA TTAATTCTTT 3 78 0 

30 GTGCGAATAC GACATCGTCA AAATAATATC TGCTTTCAAA TCTGCTTCAG TAAATTGTTG 3 840 

CGATAAGGTC GTTTCAGCTA AATGATGTTC TTCAACTAAG TCTTCAACAT AATTCGAAAC 3900 

ACCTTGATTG TTCACAGCGA ATATACCTCT TGATTCAAAT TGATGATTTG GCATAACCTC 3 960 

55 TTTTGCAATA CTTTCCGCTA ATGGG CTACG ACATGTGTTA CCTGTACAAA CGAATAAAAT 4 02 0 

CTTCATAGTT CACATCCTTT AATAATGTGA TTACCTGCAG CTTTTAACAT GCGATTCATA 4 0 80 

ATTGCTTCTG TATTATCATT CAGCTCAAAG CCGTATATAT ACGCCGCTGA AATATTTTCA 414 0 

40 

TTTTCATCAA GTGAATGTAA CACATCATAA AGATTATGAC TTGCTTGTTT AACATCATTG 4200 

TCATCCTGAC ATAATTGAAT GAATTGCGCT TCACTTGGTA TAAACGCCAC CTTATTACTC 42 6 0 

45 GGCACAATAA AAGCTATAGA AGACCAATCT TTACCGTCAT TTCCAATTTT GCTCTCAATA 4320 

TCTGTAATAA TTGTAAGTGG TGTATTGGGT GAGTAATGCT TATACTTCAT ACCTGGTGCA 4 3 80 

ATTGGCTGTT CAGTATCATT ATAATCAGCA TGGGCGATAC TATTCGGAAG TATTTCTGTA 4 44 0 

50 ATCATTGCTG CTGTTATAGA AC CAGGTCTT GCAATTTTAT AAGGAAAAGA TGTGCAATCT 4 50 0 

AAAACCGTAC TTTCTAATCC TTCTTCACTT TGTTCAGCTT GAACAATACC ATCGATACGG 4 56 0 
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GCACTTGGAG CAGCTAGAGG TT CATTTATG ATTTGTAATA ATTGTCTACC TACAGAATGG 4680 

CTTGGCATTC TAACAGCAAC TGATGATAAA CCTCCAGAAA CTTTTCGACA TAGATAGCCT 4 74 0 

5 AGCTTTAACG GCAATATAAA CGAAATAGGG CCCGGCCAGA ATGCCTGCAT TAACTTTTCT 48 00 

ACGCGTGGAT CCAAAGTATA TGTAAAATCT TTTAATTGAC CTTTACTGTG TATATGAACA 4860 

ATAAGCGGAT TGTCAGATGG ACGGCCTTTA GCTTCATATA TTTTAGCTAC AGCTTCTTCA 4 92 0 

w TCTGTCGCAT TTGCTGCAAG TCCATAAACT GTTTCAGTTG GTAAAC CTAT TAAACCACCG 4 98 0 

TTTAAAACAA TGTCTTTTAT TTCATTAATT TTAGGATATT GCTGTAAATC TTCATTATAT 5 04 0 

TCTCTAACAT CCCAAATTTT AGTATCCAAC TTAATCACGC CTTTCTTATT TATCATAATA 5100 

is 

TAAAGCAAAA AGCTATGCAC TTAACTAATC ATAGCAAAGG CATAACTTCT AATTACCATT 5160 

TAAATGAGAC GATTCGATCG TGGCCATTTA TATCTTTAAT AATGTCGATT TTTTTGTCAG 522 0 

GAAATTTATT TAAAATTATT GATTTAAGTG CCTCACCTTG ATTGTAACCA ATTTCAAAAA 52 80 

20 

CAACTGGGCT GCCTTTTTCC ATAACGTGAG GTAAATCTTC AATGATTGAT TCATAAATAG 534 0 

CATATCCATG GTTATCTGCA AACAATGCCT GATGTGGTTC GAATCTCGTA ACCGTTGGAG 54 00 

2S ACATCGTAAC CATATCTTTT TCATCTATAT ATGGTGGATT AGATATCAAG CCGTTCAACT 54 60 

TGATACCTTC ATTAATTAAG GGCTTTAATG CATCCCCTGT TAAAAATTGT ATTTGTGATT 5520 

GATGCTTCTC AGCATTATTA CGAGCCATAT TCATTGCTTC AAGTGAAATA TCAGTAGCAA 5580 

30 TAACATTTAA ATCCGGCTTT TCACATTTCA AAGTAATTGC AAGTACACCA CTACCCGTTC 564 0 

CGATATCTAC GATTGTTG CA TCATCTTCTA ACTGTTGTAA GAAATGCAAC ATTACTTCTT 5700 

CAGTTTCAGG TCTTGGTATC AAACAATTTG AGTTTACATC AAACGTTCTA CCATAAAATG 576 0 

35 AGGCAAAGCC AACTATATAC TGTATAGGCT CTCCTAATAA CATACGTTGT AATGCTAAGT 582 0 

CGAACTTCAT AATCATCGCT TTCGGCATAT CATCATGCAT GTGGACTACA AAGTCCGTAC 5880 

GCGTCCATTG AAATACATCT AACATTAACC ATTCAGCTCG TGTTTGTTCA AACCCTTTTT 5 94 0 

40 

GTTGTGTTAA ATGAATTGCT TCATCTAACT TTTCTTTATA ATTCACCATT ATTAAGTTCT 6000 

TTCAATTTAT CTGTCTGCTC TGATAAAGTC AGTGCATCTA TAATTTCTTC TAAATGG CCT 6060 

TCCATAATTT GCCCTAATTT TTGAAGCGTT AGAC CTATAC GATGGTCTGT TACACGG CTT 6120 

45 

TGTGGATAAT TATAAGTTCG AATACGTTCT GAACGATCAC CAGTACCGAC TGCTGATTTA 6180 

CGTTGTGACG CATACTTTTG TTGTTCTTCT TGAACTTTCA TATCGTATAA ACGTGCTTTT 624 0 

so AACACTTTCA TTGCTTTTTC ACGGTTTTGA ATTTGAGACT TCTcAGAAGA TGTTGCAATG 6 3 00 

ACAC CAGTTG GTAAATGGGT AATACGTACT GCAGAGTCAG TTGTGTTTAC GTGCTGACCA 6 3 60 
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ACATCTTCAA CTTCTGGTAA 


AACTGCCACT 


GTAGCTGTTG AAGTATGAAT 


ACGTCCACCT 


6480 


GATTCTGTTT CAGGCACACG 


TTGAACGCGG 


TGCGCACCAT TTTCAAATTT 


CAATTTACTA 


6540 


TACGCGCCAT TACCAGAAAC 


TGAGAAACTA 


ATTTCTTTGT AACCACCATG 


GTCACTTTCA 


6600 


GACGCTTCTA CTATTTC AG T 


TTTGAATCCT 


TGTGATTCAG CATACTTTGA 


ATACAT ACG C 


6660 


ATTAAATCAC CAGCAAAAAT 


CGCAGCCTCA 


TCACCACCTG CTGCTGCTCT 


TATTTCTACA 


6720 


ATAACGTCTT TGTCATCATT 


AGGATCTTTA 


GGAATCAATA ATATTTTAAG 


CTCTTCTTCA 


6780 


AGATTTGGAA GTTCAG CTTT 


AATACCATTA 


CTCTCCTCTT TTAACATTTC 


TACTTCTTCT 


6840 


TTATCATCAG TCTCACTTAA CATTTCTTCA ATATCAGCTA ATTCTTCTTT TTTAGCTTTA 


6900 


TAGTTACGAT AAACATCTAC 


AGTTTTTTGT 


AAATCAGCTT GCTCTTTAGA 


ATATTTACGT 


6960 


AATTTATCTG AATCATTTAC 


AACATCTGGG 


TCACTTAACA GTTCATTTAA 


CTGTTCGTAT 


7020 


CTTTCTTCTA CAATATCTAA 


TTG AT CAAAC 


ACTTATAATT CCTCCTTATT 


ATTATCACTA 


7080 


GGTGCTACGA TATGGTGCGC 


GCGACAACGT 


GGCTCATAAC TTTCATTGGC 


ACCTACTAAG 


7140 


ATAATCGGAT CATCGATTTT 


AGCTGGTTTA 


C CATTTATT A ATCGTTGCGT 


TCTACTAGAT 


7200 


GAAGAACCAC AAACAGCACA 


AACTGCTTGA 


AGTTTCGTTA CTTGTTCACT 


GACAGCCATC 


7260 


AATTTAGGCA TTGGTTCGAA 


CGGTTCGCCC 


CTAAAATCCA TATCTAATCC 


AGCAACAATA 


7320 


ACACGGTGTC CATCTG CTGA 


TAGTTTTTCT 


ACTATACTTA CAATTTCATC 


GTCAAAAAAT 


7380 


TGCAcTTCGT CTATTC CTAT 


AACATCAACA 


TTAGTTAAGT CGTGCGTCAT 


AATTTCACTT 


7440 


GCTTTAGAAA TATTAATCGC 


TTCAATGGCA 


TTACCATTAT GAGAGACCAC 


TTTTTCTTTA 


7500 


TGATATCGAT CATCAATCGC 


CGGTTTAAAT 


ACAACGACTT TTTGTTTAGC 


GTATATACCC 


7560 


CTTCTTAGAC GTCTTATTAG 


TTCTTCGGAT 


TTACCGCTAA ACATACTACC 


TGTAATACAT 


7620 


TCTATCCAAC CGGAATGGTA 


AGTTTCATAC 


ATTGAGAGTn C CACCTTTTT 


CAAAACATAA 


7680 


TCGCTTTATT ATATCATATT 


TCAAATATTC 


ATAAATGTCT TTnTCATAAT 


TATATCGATA 


774 0 


TTGTACATGA ACAATTATTT 


TA 






7762 


(2) INFORMATION FOR SEQ ID NO: 125: 







4S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2583 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(D> TOPOLOGY: linear 

so 
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TAAAAAAATT ATTATCAATG ATGAACTAGA ATTGACTGAA TTCCACCAAG AACTTACTTA 12 0 

TATTTTAGAC AACATAnAAG GGAATAATAA TTATGGTAAG GAATTTGTTG CAACCGTTGA 180 

5 AGAAACATTC GACATTGAAT AaAGCGGGGT GgaAGCACTA TGAATCAATG GGATCAGTTC 24 0 

TTAACACCTT ATAAGCAAGC GGTTGATGAG TTGAAAGkGA AcTTaAAGGC ATGCGCAAAC 3 00 

AATATGAAGT TGGTGAACAA GCGTCGCCAA TAGAATTTGT TACTGGTCGT GTTAAACCAA 36 0 

W TCGCTAGTAT TATAGATAAG GCAAACAAAC GACAAATACC ATTTGATAGG TTAAGAGAAG 420 

AAATGTACGA TATCGCTGGT TTAAGAATGA TGTGCCAATT TGTTGAAGAT ATTGATGTTG 4 80 

TCGTCAATAT TTTAAGACAA AGAmAAGATT TTAAAGTAAT TGAAGAACGA GATTATATTC 54 0 

IS 

GTAACACTAA AGAAAGTGGT TACCGCTCGT ATCATGTCAT TATTGAATAT CCAATTGAAA 60 0 

CATTACAAGG CCAAAAATTT ATATTGG CTG AGATTCAGAT TCGTACATTA GCAATGAATT 66 0 

2o TCTGGGCAAC GATTGAACAT ACTTTACGAT ATAAATATGA TGGTGCTTAT CCGGATGAAA 720 

TTCAACATCG TTTGGAAAGA GCGGCAGAAG CAGCGTATTT ACTTGATGAA GAGATGTCTG 78 0 

AAATTAAAGA TGAAATTCAG GAAGCTCAAA AATATTACAC GCAAAAACGT TCTAAAAAAC 84 0 

25 ATGAAAATGA TTAACGAGGT GTTATAAATC ATGCGTTATA CAATTTTAAC TAAAGG TGAC 90 0 

TCCAAGTCTA ATGCCTTAAA GCATAAAATG ATGAACTATA TGAAAG r TTT TcGCATGaTT 96 0 

GaGGATrGTG AAAaTCCTGA AATTGTTATT yCAGTTGGTG GTGACGGTAC ATTACTACAA 102 0 

30 GCATTCCATC AGTATAGCCA CATGTTATCA AAAGTGGCAT TTGTTGGAGT TCATACAGGT 1080 

CATTTAGGAT TTTATGCGGA TTGGTTACCT CATGAAGTTG AAAAATTAAT CATCGAAATT 114 0 

AATAATTCAG AGTTTCAGGT CATTGAATAT CCATTGCTTG AAATTATTAT GAGATACAAC 12 00 

35 GACAACGGCT ATGAAACAAG GTATTTAGCA TTAAATGAAG CAACGATGAA AACTGAAAAT 12 6 0 

GGCTCAACAC TTGTTGTGGA TGTTAACTTA AGAGGGAAAC ACTTTGAGCG ATTTAGAGGC 132 0 

GATGGATTAT GTGTATCAAC ACCTTCGGGT TCAACGGCTT ATAACAAAGC GCTAGGTGGC 13 80 

40 

GCACTGATAC ATCCTTCACT TGAAGCAATG CAAATTACAG AAATTGCCTC GATAAATAAT 144 0 

CGTGTGTTTA GAACGGTAGG ATCACCACTT GTATTACCAA AGCATCATAC ATGTTTAATA 150O 

45 TCACCAGTTA ATCATGATAC CATTAGAATG ACGATAGATC ATGTTAGTAT CAAACATAAA 156 0 

AATGTTAATT CAATACAATA CCGTGTAGCA AATGAAAAAG TGAGGTTTGC ACGTTTTAGA 1620 

CCATTCCCAT TCTGGAAACG TGTGCACGAT TCTTTCATAT CAAGTGATGA AGAACGATGA 16 80 

50 AATTTAAGTA TCATATATCA CAACAAGAAA CTGTTAAAAC TTTTTTAGCA CGACATGATT 174 0 

TTTCTAAGAA GACAGTGAGC GCCATTAAAA ATAATGGCGC TTTAATTGTT AATGATGAAC 18 0 0 
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AAATACCGAG TGTTAATTTA ATACCTTATG CTCGTAAGCT AGAAG TATTG TATGAAGATG 192 0 

CTTTTATCAT CATAGTTACT AAACCAAACA ATCAAAATTG TACGCCTTCG AGAGAACATC 19 80 

CTCATGAAAG TTTAATCGAA CAAGTACTAT ATCATTGTCA GGAACATGGT GAAAATATTA 2 04 0 

ACCCACATAT TGTTACG CGT CTAGATCGTA ATACAACTGG TATTGTGATA TTCGCTAAAT 210 0 

ATGGACATAT CCATCATTTA TTTTCTAAAG TAAACTTGAA AAAAATATAT ACTTGCCTTG 216 0 

TATATGGTAA AACCCATACA TCTGGTATTA TTGAAG CTAA TATTAGACGG TCAAAGGATA 222 0 

GGATTATAAC TAGAGAAGTT GCCTCGGATG GTAAATACGC TAAAACATCT TATGAAGTAA 228 0 

TAAATCAGAA TGATAAATAC AGTTTATGCA AAGTTCATTT GCATACGGGA CGTACACATC 234 0 

AAATTCGTGT ACATTTTCAA CATATTGGGC ATCCAATTGT GGGAGATTCT TTGTATGATG 24 0 0 

GTTTTCATGA CAAAATTCAT GGTCAAGTAC TGCAATGTAC GCAAATATAT TTTGTTCATC 24 6 0 

CAATCAATAA GAACAATATT TATATTACAA TTGATTATAA GCAATTACTT AAATTATnCA 252 0 

ATCAACTCTA ATnCACACAG GGGGTGTAAG TATGTCAATG AnCACAGATG AAAAAGAGCG 2580 

TGT 2583 
(2) INFORMATION FOR SEQ ID NO: 126: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1818 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 126: 

ATCAAGTGAT ACATTTAACT GGTAAAGGAT TAAnAGATGC TCAAGTTAAA AAATCnGGAT 6 0 

ATATACAATA TGAATTTGTT AAAGAGGATT TnACAGATTT ATTnGCAATT ACGGATACAG 120 

TAATAAGTAG AGCTGGATCA AATGCGATTT ATGAGTTCTT AACATTACGT ATACCAATGT 180 

TATTAGTACC ATTAGGTTTA GATCAATCCC GAGGCGACCA AATTGACAAT GCAAATCATT 24 0 

TTGCTGATAA AGGATATGCT AAAGCGATTG ATGAAGAACA ATTAACAGCA CAAATTTTAT 300 

TACAAGAACT AAATGAAATG GAACAGGAAA GAACTCGAAT TATCAATAAT ATGAAATCGT 360 

ATGAACAAAG TTATACGAAA GAAGCTTTAT TTGATAAGAT GATTAAAGAC GCATTGAATT -4 2 0 

AATGGGGGGT AATGCTTTAT GAGTCAATGG AAACGTATCT CTTTGCTCAT CGTTTTTACA 4 80 

TTGGTTTTTG GAATTATCGC GTTTTTCCAC GAATCAAGAC TTGGGAAATG GATTGATAAT 54 0 

GAAGTTTATG AGTTTGTATA TTCATCAGAG AGCTTTATTA CGACATCTAT CATGCTTGGG 6 00 
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CTCATGTTAA AGCGCCACAA AATTGAAGCA TTATTTTTTG CATTAACAAT GGCATTATCT 72 0 

GGAATTTTGA ATCCAGCATT AAAAAATATA TTCGATAGAG AAAGACCTAC ATTGCTGCGT 7 80 

TTAATTGATA TAACAGGATT TAGTTTTCCT AGCGGTCATG CTATGGGATC AACTG CATAT B4 0 

TTTGGAAGTG GTATCTATCT ATTAAATCGA TTAAATCAAG GTAATTCAAA AGGTATTCTT 900 

ATAGGGTTAT GTGCAGCTAT GATTTTATTG ATTTCCATAT CACGTGTATA TCTAGGTGTA 96 0 

CATTATCCAA CAGATATTAT TGCCGGCATT ATTGGTGGAT TATTTTGcAT TATTTTATCA 102 0 

ACGTTATTAC TTAGAAATAA ATTAATAAAT TAAATAGTAA AAAAACAAAA GCAGTAAACC 10 80 

TAAAGTGTCG TAAGGGTTTA CTGCT1TTAT AAAACGTTGT TATAACGTAT ATTGTCTTTT 114 0 

A CGGGCATAT AAnAGGGGAA TATTTGAnAA TGACCAATCC AACAAGAACG AAACGTTGTG 120 0 

GGGGGGATGT TCTATGTGGT ATTGATAATC ATTTTCAACT ACTATTATAC ATTAGTGAGA 12 60 

ATCATTGTCA ATTAGAAACT AAAACTTTTT TTGAATATTT TTTAAGAATA GTAAATAAAA 132 0 

CGCATGATTA CGCTATTTTA GAAAATAAAA AAATTTGTAT TT CTCATT AG AATTAGAATA 13 80 

TTTAAAAGTG ATGAGGTTTA AACATTATAT TGTTTACATA CTCCTTTTGA ATTCATACAT 1440 

TATGAAATGT tACTTCCAAG TTCAAAATCG CACATTGAAA TGATGTGTGA AATGTTTAAA 1500 

CTACGGTCAT t TTGTGmAAA TAAAGrTAAT AACTATTCAT TTTACAATAG TGAAAAGTCA 156 0 

GTATATGACA ACAATTAATA TTGCGGTAAG GCCTTGTGTT ACAGTATTCT ATATTTAAGT 1620 

ACTGCAATCA GAATTAACAG AATGCCATTA ACTGATTATT AAATATTTG A GTTAATAAAT 16 80 

AATTAATGAT TGTAGCTTGA AAAATTTAAA ACATGGTTAT TGATTTGTGA TAAAATTTAA 174 0 

ACGTAAACAA ACTAATTTAA AAAGCAACTA TTGTATAGAA AAATACAAAA TTTAAAATAT 1800 

ATTACCTTAT TAGAAAAA 1818 
(2) "i NFORMAT I ON FOR SEQ ID NO: 127: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 12658 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 127: 

TGTTTAAACA ATAGGGGGAA TCTTATGATT GAAAAATTAG TAACCTTTTT AAATGAGGTT 6 0 

GTTTGGAGTA AGCCATTAGT TTATGGTTTG CTAATTACTG GTGTGCTATT TACATTGCGT 120 

ATgCGATTTT TTCAAGTTAG ACATTTTAAA GAAATGATTC GATTAATGTT TCAAGGAGAG 180 
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GGTACAGGTA ATATTGTCGG TGTATCTACT G CAATATTT A TAGGAGGACC TGGTGCAGTA 3 00 

TTTTGGATGT GGATTACTGC GTTTTTAGGT GCAAGTAGTG CTTTTATTGA ATCTACACTT 3 SO 

GGTCAAATAT TCAAGAGAGT TGAAAATAAT GAATACCGTG GTGGACCAGC GTATTATATT 420 

GAATATGGTA TTGGTGGTAA ATTTGGTAAA ATTTACGGAA TTATCTTTGC TATTGTTACG 4 80 

ATTATCTCAG TAGGTCTATT GCTTCCTGGT GTGCAATCTA ACGCTATAGC AAGTTCTATG 54 0 

CATAATGCGA TTCATGTTCC ACAATGGTTA ATGGGTGGTA TTGTTGTAGT TATTTTGGGA 60 0 

TTAATTATTT TTGGTGGTGT ACGTATTATT GCCAATGTTG CAACAGCCGT TGTACCATTT 66 0 

ATGGGAATTA TTTACATACT GATGGCTGTC ATTATCATTT GTATCAATAT ACAAGAAGTG 72 0 

CCAGCGTTAT TTG CATTAAT TTTCAAATCA GCATTTGGAT TACAATCTGC TTTTGGTGGT 7 80 

ATCGTTGGCG CAATGATAGA GATTGGTGTT AAACGTGGAT TATATTCAAA TGAGGCTGGT 84 0 

CAAGGTACAG GTCCACACGC AGCAGCGGCa gcAGaAGTAT CACATCCAAG TAAACAAGGT 900 

CTAGTACAAG CATTTTCAGT TTATATTGAT ACATTATTTG TATGTACTGC AACTGCTCTG 96 0 

ATTATACTTA TTTCTGGTAC ATATAATGTG ACTGATGGTA CGGTTAATGC GAATGGCACA 102 0 

CCGCATTTAA TTAAAGATGG CGGTATTTAT GTTgAAAATG CAACAGGTAA AGATTATTCA 108 0 

GGTACTGCGA TGTATGCACA AGCCGGCATC GATAAAGCGT TCCATGGCAG TGGTTATCAA 1140 

TTTGATCCTA CTTTCTCTGG CGTAGgTTCG TACTTTATTG cATTTGCTTT ATTCTTCTTT 12 0 0 

GCATTTACTA CAATTTTGTC GTACTACTAC ATTACAGAAA CAAATGTTGC TTATTTAACG 12 60 

CGTAATCAAA ATAATCAAGT TTCATCGATA TTTATTAATA TTGCTCGTGT GATTATTTTG 13 20 

TTCGCTACAT TTTACGGTGC AGTTAAAACA GCTGATGTAG CATGGGCATT CGGTGATTTA 1380 

GGTGTAGGTC TAATGGCTTG GTTAAATATC ATTGCGATTT GGATTTTACA TAAGCCTGCC 144 0 

GTAAATGCTT TAAAAGATTA TGAAATTCAA AAGAAACGTT TAGGCAACGG TTATAATGCA 1500 

GTTTATCAAC CTGATCCGAA TAAATTA CCT AATGCTGTCT TTTGGTTGAA GACGTATCCA 156 0 

GAAC GTTTAA AACAAGCACG TGCCAAAAAG TAATCTACTT TTGTTTATAG TATATGTAGT 1620 

GATCATTTGA TAAAAAAGAA AAGTATTGAG AATTTTAGGt GCTCAGAAAT TTGAATTTTA 1680 

AAAATATAGT GTCTCTTGGT ACAATAACAA TACAACTACT AGGGGCACTT TTTTATGTCA 174 0 

GAATTTAAAA CTGGTAAGAT TAATAAACAT GTTTTATATA GTAATATTTT AAATAGAGAT 180 0 

GTCACGTTAA GTATTTATTT ACCAGAATCT TATAATCAAC TTGTTAAATA TAATGTCATT 186 0 

CTTTGCTTTG ACGGATTAGA TTTTTTACGT TTCGGGAGAA TACAACGTAC ATATGAATCG 192 0 

TTAATCAAAG AAGCGCGTAT TGATGATGCG ATCATTGTTG GATTCCATTA TGAAGACGTT 1980 
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GTCGGTAAAG AAATATTGCC ATTTATTGAC TCGACGTTTT CTACACTGAA AGTAGGTAAT 2100 

GCAAGGTTAT TAGTAGGGGA TAGTTTAGCG GGTAGTATTG CCTTATTAAC GGCGTTGACC 216 0 

s TATCCAACGA TTTTTAGTCG TGTAGCAATG TTAAGTCCAC ATTCAGATGA AAAAGTATTA 2 22 0 

GATAAGCTAA ATCAATGTGC AAATAAAGAA CAATTGACAA TTTGGCATGT CATTGGTCTA 2 28 0 

GATGAAAAAG ATTTTACTTT ACCAACAAAT GGTAAGCGTG CCGATTTCTT AACACCGAAT 2 34 0 

10 

AGAGAATTAG CTGAACAAAT TAAGAAATAT AATATAACTT ATTATTACGA TGAATTTGAT 24 00 

GGTGGTCACC AATGGAAAGA TTGGAAACCA TTGCTGTCAG ATATATTATT GTATTTTTTA 24 60 

AGTAAAAACA CAGATGATCA ACTTTATGAA TAATTTACAT TAGTAGATTT AGTATGAATT 2 52 0 

IS 

GTCTTCATAT AGTCTGGTCT ATAATATAAT TTATAAAAGA TTTTACTGTT TAATTTAATT 258 0 

TAAATTTGAC GAAATTGCAA AAGATGTATA ATGAATTATT TTTAATGTAA CGGTTTTCAA 264 0 

2o AGAAATTTGA TATAATAGCA ATAGGTTAAA CAAAGGAGGA ATTCAGATGA TTTTAGGATT 2 7 00 

AGCATTAATT CCATCAAAGT CATTTCAAGA AG CGGTGGAT TCTTACCGTA AAAGATATGA 27 6 0 

TAAACAGTAT TCACGAATTA AACCACATGT GACAATTAAA GCGCCATTTG AAATTAAAGA 2 820 

25 TGGTGATTTA GATTCTGTCA TTGAACAGGT TAGAGCTCGT ATTAATGGTA TACCAGCAGT 288 0 

AGAAGTTCAT GCTACAAAAG CTTCTAGCTT CAAACCAACG AACAATGTGA TTTACTTTAA 2 94 0 

AGTTGCGAAG ACGGACGACT TAGAAGAATT GTTTAATCGC TTTAATGGAG AAGATTTCTA 3 0 00 

30 TGGAGAAGCT GAACATGTTT TTGTGCCACA CTTTACAATA GCACAAGGAC TATCTAGCCA 3 0 60 

AGAATTCGAA GATATTTTTG GTCaAGTAGC ATT AG CTGGG GTAGACCaTA AAGAAATTAT 3120 

CGATGAATTA ACTTTGTTAC GTTTTGACGA TG A CGAAGAT AAATGGAAAG TTATTGAAAC 318 0 

35 GTTTAAATTA GCTTAAGTAA CAT AATA GT A TTGTTAATCG TAGTATGTTT GAATTAATAA 3 24 0 

GAAAATGGTC ATTTTTATTG AATGTAATAA AAATGACCAT TTTCTTTATT TTAAAATACG 330 0 

TTTTAACCTT ACTTAGCTTT TTCTCTATTT ACTATAAAGT rGCTTCCATA AAATACAGCT 33 6 0 

40 

AAGACTAAAA AGATTAATGC CGAGAAATAA AATGTATTGT TTAAATTGTT GGTAAATTGT 34 2 0 

GTAATTAATC CGCCAAATAA TGGCCCTATC ATTGAGCCGA ATCCTTGGAT ACTATTAAAA 34 8 0 

ACACCCCAAG TTTCTTCTTG TTCATCTGAT TTGATAAATC GTGCCATAAA GGTATTCCAT 354 0 

45 

GCTGGTAATA AGATGCCATA CATTAGACCG ATAGCTAAAG CGATAATCCA CAAGATGTGA 360 0 

ATATTAACAA TCATAGATAG AGTAAAAATT AATATCATGT ATAAAATAAA TCCGCTTAGA 366 0 

50 ATAACACCAT ACATAAAGTT TCTGCTGCGG TTATCTATTA GTTTCGATAA AAATAGCATC 3 72 0 

GAAACTGCAC AGCCGATACC ACCAATAATG ATTGCAACAG TATATTCAAT TGTGCTTACG 378 0 
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TGTAAAAGAA TACCAGGGAA CaACAATAAA TGGcGCTTTG TCACATCAAC AATTTGTCTC 3 900 

AATTGAGCTT TAACTGGACG AGTATTATAA TTTGTTAACT TTACATCGAC AAAATAATAT 3 96 0 

5 AATATCCATG CAATTAAAAC GACTAAAGAC ATCATGAAGG CAAAG CGTGT TGGGTGCACT 4 02 0 

TTGATAAGTA GATTCATAAA AACCATACCT AC CAATAGGC CTAACAACCA TGAAAAATAA 4 080 

ACATAGCCCA TTTGTTTGCC ACGTTTATCT TCTTCAACAC TGGATAACAT AATG AC CCAA 414 0 

10 

ATAGGACTAA CTG CAATACC GAGCATCATA GCACTAAATA TGATTACAAA AGGTGATGCT 4 200 

GGAAACCAAA TAACTAAAAA TAAACTTGTA AATGCTAAAA TAAATCCAGT CGTTAAAACG 4 26 0 

ATTTTTGTGC CGAATTTTTT CAGTAAAAAT CCTATAACAA AG TTTGT AGA TGCATCAGCA 4 3 20 

15 

ATAAAATGTA TTGAAAATGC TAGAGACGTT ATTGCTACAG CAATGGATGT AACTGTTGGC 4 3 80 

AAGAAATTAA TATAGCTTAG GATATACATG CCTCTCGCAA ATTCCATTAA AAATAAGATA 4 440 

20 ATAAGCaTTA AAATGAAATT TTTATGATTA GCGTAATTAT TTAACGAAGA ATCTTGCATA 4 500 

TAAAGGAACC TTTCCATAAA TCTCTTGTGG TTGTGATGAA TGAC CGATTA AATCAAGTAA 4 560 

GTCTCGACAT ATTGTCTGTG TAG CATACTT AATTTTATCT TGTTCCATTG TACTAATCAT 4 620 

25 GTTAGTTAAT TGCTCATTAC CGTTAGTTAA ACTTG CTAC A ATTTTTATTG CTTCTTCTGG 4 680 

AGTATCAGCG ATTTTACCAA AACCTTTTTC TTCAAAGTAA AGGGCATTTT CAAGCTCTTG 4 74 0 

ACCAGGTGCA GGATTTAGGA AAATCATTGG AATACAACGG GCGAAACCTT CAGTTATTGT 4 800 

30 GATACCACCA GGTTTCGTAA TCATAAGTTG ACTTGATGCC ATCCATTCAT TCATGTGTTT 4 86 0 

GGTATAACCT AGAATCAATA CATTCTCGTT AGATTTAAAC TTAGCTGTTA AAGAACGCTT 4 92 0 

TAGCTCTTTG CTCTTACCAC AAATCATAAC TACTTGTGCA TTTGCaCTTT tCGCTAATAT 4 980 

35 ATCAGTAATC ATCGTGTCAA AACCTTTAGA TACACCAAAT GCAC CAGCTG a CATTAAAAT 5 04 0 

AGTTTGCTTA TCTGGATCTA AGTTGTTGTC TATTAACCAC TGCTTTTGAT TAATAGGCGT 5100 

TTCAAATTTG TTATCAATAG GAATACCTGT CaCTTTAACT GTTGAAGGAT CAATACCTAC 516 0 

40 

GTCTATGAAG TCTTGTTTCG TTTCTTTTGT TGCCACATAA TATCTTGTTG AATACGGCGT 5 220 

AATCCAGTTT TTATGTAAGC GATAGTCTGT CATCACTGTA GCAACTGGAA TATTAATGTT 52 80 

AAATTGCTCA GTTAGTA CCG ACATAACTGG TGTAGGAAAC GTTAATAATA TTAAATCTGG 534 0 

45 

C TT TTC T T TT AT CAATAAAT TAATTAA CTT ATTAAGTCCA TAGTATTTGT AAAAACATTT 5400 

GTCTAGTTTA TCTGGGCGGC TGTAATAAAA CCCTTTGTAC ATATTTCTAA AATATTTAAA 54 6 0 

50 GCTATTGATA TACCATTTTT TACAAATAGA AGTCAAAATT GGATGAGCTT CCATAAATAA 552 0 

ATCGTG CTCA ATGACGCTTA AATGGTCTAG ATTCATATCA TTAAGTTGAT TAACGATAC T 558 0 
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TTGAGTAACC ATTAATAGCC ACCCTCCGTT AGTTTGAAAA TTTTATTTAA GTGTAACTTA 57 00 

TTTTACGGCA TTATAAAAGA AATAAAGACG CAAAGTCGTT ACATTTATAG CAATTTTAAT 5 7 60 

5 CTATAGATGA ATTGATACAA AATAAAACGT TATTTTATAA AG CAATTTAT TGTTCTATGT 5 82 0 

TTTATTTGTA TATTTAAAAT TATCCAGTAT ACAATTATAG CATATTTTTG GAAACAATTA 5880 

TGATATTATA CCATGTTACA AGATGGTTTT AATAATTTAA GATGAGC CAT AATTGTAAAA 5 94 0 

!0 

CTAATT CATA ATACCGTATG TTTTATTTTT AATAGTAGAA ATTAGAAAAT G CTG ATTAGT 6 0 00 

AGGATATAAC AGTGAAATTA TAAATTTATT AACATCAACA AAACGTGTAT AATAAACATA 6 06 0 

TTGTAGAAAA AGGAGCGGTT CAGTTTGGAT GCAAGTACGT TGTTTAAGAA AG TAAAAGTA 612 0 

IS 

AAGCGTGTAT TGGGTTCTTT AGAACAACAA ATAGATGATA TCACTACTGA TTCACGTACA 6180 

GCGAGAGAAG GTAGCATTTT TGTCGCTTCA GTTGGATATA CTGTAGACAG TCATAAGTTC 624 0 

2Q TGTCAAAATG TAG CTGATCA AGGGTGTAAG TTGGTAGTGG TCAATAAAGA ACAATCATTA 630 0 

CCAGCTAACG TAACACAAGT GGTTGTGCCG GACACATTAA GAGTAGCTAG TATTCTAGCA 6360 

CACACATTAT ATGATTATCC GAGTCATCAG TTAGTGACAT TTGGTGTAaC GGGTACAAAT 64 2 0 

25 GGTAAAACTT CTATTGCGAC GATGATTCAT TTAATTCAAA GAAAGTTACA AAAAAATAGT 64 8 0 

GCATATTTAG GAACTAATGG TTTCCAAATT AATGAAACAA AGACAAAAGG TGCAAATACG 6 54 0 

ACACCAGAAA CAGTTTCTTT AACTAAGAAA ATTAAAGAAG CAGTTGATGC AGGCGCTGAA 6 60 0 

30 TCTATGACAT TAGAAGTATC AAGCCATGGC TTAGTATTAG GACGACTGCG AGG CGTTGAA 6660 

TTTGACGTTG CAATATTTTC AAATTTAACA CAAGACCATT TAGATTTTCA TGGCACAATG 6 72 0 

GAAGCATACG GACACGCGAA GTCTTTATTG TTTAGTCAAT TAGGTGAAGA TTTGTCGAAA 6 78 0 

35 GAAAAGTATG TCGTGTTAAA CAATGACGAT TCATTTTCTG AGTATTTAAG AACAGTGACG 6 840 

CCTTATGAAG TATTTAGTTA TGGAATTGAT GAGGAAGCCC AATTTATGGC TAAAAATATT 6 900 

CAAGAATCTT TACAAGGTGT CAGCTTTGAT TTTGTAACGC CTTTTGGAAC TTACCCAGTA 6 96 0 

AAATCGCCTT ATGTTGGTAA GTTTAATATT TCTAATATTA TGGCGGCAAT GATTGCGGTG 7 020 

TGGAGTAAAG GTACATCTTT AGAAACGATT ATTAAAGCTG TTGAAAATTT AGAACCTGTT 7080 

GAAGGG CG AT TAGAAGTTTT AGATCCTTCG TTACCTATTG ATTTAATTAT CGATTATGCA 714 0 

45 

CATACAGCTG ATGGTATGAA CAAATTAATC GATGCAGTAC AGCCTTTTGT AAAGCAAAAG 7 2 00 

TTGATATTTT TAGTTGG TAT GGCAGGCGAA CGTGATTTAA CTAAAACGCC TGAAATGGGG 72 60 

so CGAGTTG CCT GTCGTGCAGA TTATGTCATT TTCACACCGG ATAATCCGGC AAATGATGAC 732 0 

CCGAAAATGT TAACGGCAGA ATTAGCCAAA GGTGCAACAC ATCAAAACTA TATTGAATTT 73 8 0 
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GTTTTAGCAT CAAAAGGAAG AGAACCATAT CAAATCATGC CAGGGCATAT TAAGGTGCCA 7 50 0 

CATCGAGATG ATTTAATTGG CCTTGAAGCA GCTTACAAAA AGTTCGGTGG TGGCCCTGTT 756 0 

GATTAATAAA AGATTTATTG ATGAAGGTAA AACTATTGAT GTTTATTTAT TCGAAGCATT 762 0 

AAATAACCAG ATAATCATTG CTATACCAGA TTGGTTTTGG TCATATCAGA TGGCAATGAC 76 8 0 

ATTAGATGAA GAAACTTGTT TTGAAGCAAT ACTCATGCAA TTGTTTGTTT TTAAAGAAGA 774 0 

GGAAGAGGCA GAATCGATTG CATCACAACT AACAGATTGG ATAGAAACAT ATAAAAAGGA 7 80 0 

GAAAGACTAA TGAACTTAAA GCAAGAAGTT GAGTCTAGAA AGACTTTTGC GATTATTTCA 7 86 0 

CATCCCGATG CAGGGAAAAC AACGTTAACT GAAAAACTAT TGTACTTCAG TGGTGCTATT 7 92 0 

CGTGAAGCGG GTACAGTTAA AGGGAAGAAG ACTGGTAAAT TTGCGACAAG TGACTGGATG 7 98 0 

AAAGTTGAAC AAGAGCGTGG TATTT CTGTA ACTAGTTCAG TAATGCAATT TGATTACGAT 8 04 0 

GATTATAAAA TCAATATCTT AGATACACCA GGACATGAAG ACTTTTCAGA AGATACGTAT 8100 

AGAACATTAA TGGCAGTTGA CAGTGCTGTC ATGGTCATAG ACTGTGCAAA AGGTATTGAA 8160 

CCACAAACAT TGAAGTTATT TAAAGTTTGT AAAATGCGTG GTATTCCAAT CTTTACATTC 8220 

ATTAATAAAT TAGACCGAGT AGGTAAAGAA CCATTTGAAT TATTAGATGA AATCGAAGAG 82 8 0 

ACATTAAATA TTGAAACATA CCCTATGAAT TGGCCAATTG GTATGGGACA AAGTTT CTT T 83 4 0 

GGCATCATTG ATAGAAAGTC TAAAACAATT GAACCATTTA GAGATGAAGA AAATATATTA 84 0 0 

CATTTGAATG ATGATTTTGA GTTGGAAGAA GATCATGCAA TTACAAATGA TAGTGATTTT 84 60 

GAACAAGCGA TTGAAGAATT AATGTTGGTT GAAGAAGCGG GTGAAGCCTT TGATAATGAC 85 20 

GCG CTGTTGA GTGGAGACTT AACACCTGTA TTTTTCGGTT CAGCTTTAGC TAACTTTGGT 8 580 

GTACAAAATT TCTTAAATGC ATATGTTGAT TTTGCGCCAA TGCCAAATGC GAGACAAACA 864 0 

AAAGiAGACG TTGAAGTAAG CCCGTTTGAT GATTCATTTT CAGGATTTAT CTTTAAAATT 87 00 

CAAGCCAACA TGGACCCTAA ACAC CGTGAT AGAATTGCCT TTATGCGTGT CGTTAGTGGT 87 60 

GCATTTGAAC GTGGTATGGA TGTTACTTTG CAACGTACTA ATAAAAAGCA AAAGATCACA 88 2 0 

CGTTCAACGT CATTTATGGC AGACGATAAA GAAACTGTGA ATCATGCTGT AGCAGGCGAT 88 8 0 

ATCATTGGAC TATATGATAC TGGTAATTAT CAAATTGGAG ATACTTTAGT TGGTGGAAAA 8 94 0 

CAAACCTACA GTTTC CAAGA TTTACCACAA TTTACGCCAG AAATTTTTAT GAAAGTTTCT 90 00 

GCTAAAAACG TCATGAAACA GAAGCATTTC CATAAAGGTA TTGAACAATT AGTACAAGAA 9 06 0 

GGTGCGATTC AATACTATAA AACATTACAC ACAAACCAAA TTATTTTAGG TGCTGTTGGT 9120 

CAGTTACAAT TTGAAGTTTT CGAACATAGA ATGAAAAACG AATATAATGT TGATGTTGTT 9180 
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AAGATGAACA 


CATCAAGATC 


GATTTTAGTG 


AAAGATAGAT ATGACGATTT AGTATTCTTA 


9300 


TTTGAAAATG 


AATTTGCAAC 


AAGATGGTTT 


GAAGAGAAAT 


TCCCTGAAAT 


TAAATTGTAT 


9360 


AGTTTACTTT 


AACAGCTCAA 


TTGTATAATC 


GAATTTG TTA 


CATTAAAAAT 


AATTGTTTCG 


9420 


TTGAAGAAAA 


ATAAATTGTA 


TATTTTAAAA 


GAAAAAGGTA 


TACTATGATG 


TATCAAATGA 


9480 


ATAACCTATG 


GCATTTTGTC 


AGAGGGGAGT 


AACTTAAGAA 


TCATGACCGT 


ATAAATGaTT 


9540 


CGACACTTTA 


TCGTCATTAC 


GArGATATCT 


TCCGGTAAAG 


TGGGCAATTT 


AAATTG CTTA 


9600 


GTGAGACCTT 


TGCTATTTAT 


TTAGCATAGG 


TCTTTTTGTT 


TGTACTTAAC 


TTATTTATTT 


9660 


AAAGGAGTTG 


TACATGTTAA 


TGGATCCAAG 


TTTGATCTTA 


CCTTATTTAT 


GGGTACTTGT 


9720 


CGTTTTAGTA 


TTTTTAGAAG 


GCTTATTAG C 


AGCAGATAAC 


GCGATTGTTA 


TGG CTGTAAT 


97B0 


GGTTAAGCAC 


TTACCACCCG 


AACAACGTAA 


AAAAGCTTTG 


TTTTACGGTT 


TGTTAGGTGC 


9840 


ATTTGTATTT 


AGATTTTTAG 


CATTATTCTT 


AATTAGTATT 


ATCGCGAACT 


TTTGGTTTAT 


9900 


TCAAGCTGCA 


GGAGCGGTTT 


ACTTAATTTA 


TATGTCAATC 


AAAAATCTGT 


GGCAGTTCTT 


9960 


TAAACACCCA 


GAAATTGAAA 


GTCCTGAAGC 


TGGAGATGAT 


CATCATTATG 


ATGAATCTGG 


10020 


TGAAGAGATT 


AAAGCAAGTA 


ACAAATCATT 


CTGGGGAACT 


GTGTTGAAAA 


TAGAATTTGC 


10080 


AGATATCGCA 


TTTGCCATTG 


ATT CTATGCT 


TGCTGCTTTA 


gCTATTGCTG 


TAACACTTCC 


10140 


TAAAGTTGGT 


ATTCACTTTG 


GTGGTATGGA 


CTTAGGT CAG 


TTCGTAGTCA 


TGTTCCTAGG 


10200 


TGGAATGATT 


GGTGTTATTC 


TAATGCGTTA 


TGCAGCAACA 


TGGTTTGTAG 


AGCTATTAAA 


10260 


CAAATATCCA 


GGA CTTGAAG 


GTGCAGCCTt 


CGCGATCGTT 


GGTTGGGTAG 


GTGTTAAATT 


10320 


AGTTG TCATG 


GTATTAGCGC 


ACCCAGACAT 


C GCT GTATTG 


CCTGAG CACT 


TCCCACATGG 


10380 


CGTATTATGG 


CAATCTATTT 


TCTGGACAGT 


ACTAATTGGA 


TTAGTAATTA 


TCGG TTGGTT 


10440 


AGGTTCAGTT 


GTTAAAAATA 


AAAAATCGCA 


TAAATAATTG 


ATGTGAAGCG 


GACAAT CTTA 


10500 


ATTTAGTTTA 


AGGTTGTCCT 


TTTTCATTTA 


ATTGAGTGAT 


TTATGAAAAA 


TGGATTTTGA 


10560 


AGAATGTGAA 


TCAAAAGATG 


CGATATAGTA 


TTAAGAAAAT 


GTGCCTTTTA 


TATTTAGCAT 


10620 


TTTTTCAATA 


GAAATTATAT 


AG AT TTT AAA 


GCAAATTAGG 


TGTTAATGTG 


TCATAATGAT 


10680 


AAGTGATTTT 


ATTGAATGGA 


GTGGACATTA 


GTGGATATTG 


GTAAAAAACA 


TGTAATTCCT 


10740 


AAAAGTCAGT 


nACCsaCGTA 


AGCGT CGTG A 


ATTCTTCCAC 


AACGAAGACA 


GAGAAGAAAA 


10800 


TTTAAATCAA 


CATCAAGATA 


AACAAAATAT 


AGATAATACA 


ACATCAAAAA 


AAGCAGATAA 


10860 


GCAAATACAT 


AAAGATTCAA 


TTGATAAGCA 


CGAACGTTTT AAAAATAGTT TATCATCGCA 


10920 


TTTAGAACAG 


AGAAACCGTG 


ATGTTAATGA 


GAATAAAGCT 


GAAGAAAGTA AAAGTAATCA 
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AAATTCATTA GATTCAGTGG ACCAAGATAC AGAGAAATCA AAATATTATG AGCAAAATTC 11100 

TGAAGCGACT TTATCAACTA AATCAACCGA TAAAGTAGAA TCAACTGAAA TGAGAAAGCT 11160 

5 AAGTTCAGAT AAAAACAAAG TTGGTCATGA AGAGCAACAT GTACTTTCTA AACCTTCAGA 112 20 

ACATGATAAA GAGACTAGAA TTGATTCTGA GTCTTCAAGA ACTGATTCAG ACAGCTCGAT 11280 

GCAGACAGAG AAAATAAAAA AAGACAGTTC AGATGGAAAT AAAAGTAGTA ATCTGAAATC 113 4 0 

TGAAGTAATA TCAGACAAAT CAAATACAGT ACCAAAATTG TCGGAATCTG ATGATGAAGT 114 0 0 

AAATAATCAG AAGCCATTAA CTTTACCGGA AGAACAGAAA TTGAAAAGAC AGCAAAGTCA 114 60 

, s AAATGAGCAA ACAAAAACCT ATACATATGG TGATAGCGAA CAAAATGACA AGTCTAATCA 11520 

TGAAAATGAT TTAAGTCATC ATATACCATC GATAAGTGAT GATAAAGATA ACGTCATGAG 115 80 

AGAAAATCAT ATTGTTGACG ATAATCCTGA TAATGATATC AATACACCAT CATTATCAAA 1164 0 

20 AACAGATGAC GATCGAAAAC TTGATGAAAA AATTCATGTT GAAGATAAAC ATAAACAAAA 117 0 0 

TGCAGACTCG TCTGAAACGG TGGGATATCA AAGTCAGTCA ACTGCATCTC ATCGTAGCAC 11760 

TGAAAAAAGA AATATTTCTA TTAATGACCA TGATAAATTA AACGGTCAAA AAACAAATAC 1182 0 

AAAGACATCG GCAAATAATA ATCAAAAAAA GGCTACATCA AAATTGAACA AAGGGCGCGC 1188 0 

TACGAATAAT AATTATAGTG ACATTTTGAA AAAGTTTTGG ATGATGTATT GGCCTAAATT 11940 

AGTTATTCTA ATGGGTATTA TTATTCTAAT TGTTATTTTG AATGCCATTT TTAATAATGT 12 00 0 

30 

GAACAAAAAT GATCGCATGA ATGATAATAA TGATG CAGAT GCTCaAAAAT ATACGACAAC 120 60 

GATGAAAAAT GCCAATAACA CAGTTAAATC GGTCGTTACA GTTGAAAATG AAACATCAAA 12120 

35 AGATTCmTCA TTAC CTAAAG ATAAAGCATC TCaAGACGAA GTGGGATCAG GTGTTGTATA 12180 

TAAAAAATCT GGAGATACGT TATATATTGT TACGAATGCA CACGTTGTCG GTGATAAAGA 1224 0 

AAATCaAAAA ATAACTTTCT CGAATAATAA AAGTGTTGTT GGGAAAGTGC TTGGTAAAGA 12 3 00 

40 TAAATGGTCA GATTTAGCTG TTGTTAAAGC AACTTCTTCA GACAGTTCAG TGAAAGAGAT 12360 

AGCTATTGGA GATTCAAATA ATTTAGTGTT AGGAGAGCCA ATATTAGTCG TAGGTAATCC 1242 0 

ACTTGG TGTA GACTTTAAAG GCACTGTGAC AGAAGGTATT ATTTCAGGTC TGAACAGAAA 12480 

45 

TGTTCCTATT GATTTCGATA AAGATAATAA ATATGATATG TTGATGAAAG CTTT CCAAAT 12540 

TGATGCATCA GTAAATCCAG GTAACTCGGG TGGTGCTGTC GTCAATAGAG AAGGAAAATT 12 6 00 

sq AATAGGTGTA GTTGCAGCTA AAATTAGTAT GCCAAACGTT GAAAnTATGT CATTTGCA 12658 

(2) INFORMATION FOR SEQ ID NO: 12 8: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 6048 base pairs 

55 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

£ 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 128: 

TGAAATnGAA TAGTACTATT GCAAGTGTAA AGAGGTTAAT TTTTGCCnCA CGCGGGACTT SO 

i0 AAAAAGGCAA CCACTGGTTG TGACATATCC TTATTTACAT TTATAAATAT AAGGAGGAGG 12 0 

TAG TAG TGAA AGACTTATTG CAAGCACAGC AAAAGCTTAT ACCGGATCTC ATAGATAAAA 18 0 

TGTATAAACG TTTTTCTATT CTTACTACTA TCTCAAAAAA TCAGCCTGTC GGACGTCGAA 24 0 

15 GTTTAAGCGA ACATATGGAT ATGACTGAAC GTGTACTGCG TTCTGAAACA GATATGCTTA 3 00 

AGAAACAAGA TTTGATAAAA GTTAAGCCTA CCGGAATGGA AATTACAGCT GAAGGTGAGC 360 

AACTGATTTC GCAATTGAAA GGTTACTTTG ATATCTATGC AGATGATAAT CGTCTGTCAG 420 

AAGGTATTAA GAATAAATTT CAAATTAAGG AAGTTCATGT TGTTCCTGGT GATGCTGATA 4 80 

ATAGTCAATC TGTTAAAACA GAATTAGGTA GACAAGCAGG TCAATTACTT GAAGGCATAT 54 0 

TACAAGAAGA CGCGATAGTT GCTGTAACTG GCGGATCCAC GATGGCATGT GTTAGTGAAG 6 00 

25 

CAATTCATTT ATTACCATAT AATGTATTCT TCGTACCAGC CAGAGGTGGA CTAGGCGAAA 660 

ATGTTGTCTT TCAGGCAAAC ACAATTGCAG CCAGTATGGc aCAACAAGCT GGCGGTTATT 720 

30 ATACGACGAT GTATGTACCT GATAATGTCA GTGAAaCAAC ATATAATACA TTGTTGTTAG 7 80 

AGCCATCAGT CATAAACACT TTAGACAAAA TTAAACAAGC AAACGTTATA TTACACGGCA 84 0 

TTGGTGATGC GCTGAAGATG GCGCATCGAC GTCAATCACC TGAAAAGGTC ATTGAACAAC 900 

35 TTCAACATCA TCAAGCTGTC GGAGAGGCAT TTGGTTATTA TTTTGATACA CAAGGTCAAA 960 

TTGT CCATAA GGTTAAAACA ATTGGACTTC AATTAGAAGA CCTTGAATCA AAAGACTTTA 10 20 

TTTTTGCAGT TGCAGGAGGC AAATCGAAAG GTGAAGCAAT TAAAGCATAC TTGACGATTG 10 80 

40 CACCCAAGAA TACAGTGTTA ATCACTGATG AAGCCGCAGC AAAGATAATA CTTGAATAAG 114 0 

AGATAAAAAG TTTAATACTT TTTAAATATC ATTTTAAAGG AGGCCATTAT AATGG CAGTA 12 00 

AAAGTAGCAA TTAATGGTTT TGGTAGAATT GGTCGTTTAG CATTCAGAAG AATTCAAGAA 1260 

45 

GTAGAAGGTC TTGAAGTTGT AG CAGTAAAC GACTTAACAG ATGACGACAT GTTAGCGCAT 1320 

TTATTAAAAT ATGACACTAT GCAAGGTCGT TTCACAGGTG AAGTAGAGGT AGTTGATGGT 13 80 

50 GGTTTCCGCG TAAATGGTAA AGAAGTTAAA TCATTCAGTG AACCAGATGC AAGCAAATTA 14 4 0 

CCTTGGAAAG ACTTAAATAT CGATGTAGTA TTAGAATGTA CTGGTTTCTA CACTGATAAA 1500 

GATAAAGCAC AAGCTCATAT TGAAGCAGGC GCTAAAAAAG TATTAATCTC AGCACCAGCT 156 0 

55 
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ACAGTTGTTT CAGGTGCTTC ATGTACTACA AACTCATTAG CACCAGTTGC TAAAGTTTTA 16 8 0 

AACGATGACT TTGGTTTAGT TGAAGGTTTA ATGACTACAA TTCACGCTTA CACAGG TG AT 174 0 

CAAAATACAC AAGACGCACC TCACAGAAAA GGTGACAAAC GTCGTGCTCG TGCAGCGGCA 1800 

GAAAACATCA TCCCTAACTC AACAGGTGCT GCTAAAG CTA TCGGTAAAGT TATTCCTGAA 186 0 

ATCGATGGTA AATTAGATGG TGGTGCACAA CGTGTTCCTG TAGCTACAGG TTCATTAACT 192 0 

GAATTAACAG TAGTATTAGA AAAACAAGAC GTAACAG TTG AACAAGTTAA CGAAGCTATG 1980 

AAAAATGCTT CAAACGAATC ATTCGGTCAC ACTGAAGACG AAATCGTTTC TTCAGACGTT 2 04 0 

GTAGGTATGA CTTACGGTTC ATTATTCGAC GCTACACAAA CTCGTGTAAT GTCAGTTGGC 2100 

GACCGTCAAT TAGTTAAAGT TGCAGCTTGG TATGATAACG AAATGTCATA TACTGCACAA 2160 

TTAGTTCGTA CATTAGCATA CTTAGCTGAA CTTTCTAAAT AATTTTAGTA TAGTTTTTAT 22 2 0 

TCAAATACGC TAGTGCTCAG AACTATTTAG CATTAATTAA AG CTTATG AG TAAGCGGGGA 2280 

GCACAAACGC TTCTCCGCTT ATTTTTATAT AAAATTTCCT AATTACAAGG AGGAAACACC 2340 

ATGGCTAAAA AAATTGTTTC TGATTTAGAT CTTAAAGGTA AAACAGTCCT AGTACGTGCT 24 00 

GATTTTAACG TACCTTTAAA AGACGGTGAA ATTACTAATG ACAACCGTAT CGTTCAAGCT 24 6 0 

TTACCTACAA TTCAATACAT CATCGAACAA GGTGGTAAAA TCGTA CTATT TTCACATTTA 252 0 

GGTAAAGTGA AAGAAGAAAG TGATAAAGCA AAATTAACTT TACGTCCAGT TGCTGAAGAC 2580 

TTATCTAAGA AATTAGATAA AGAAGTTGTT TTCGTAC CAG AAACACGCGG CGAAAAACTT 264 0 

GAAGCTGCTA TTAAAGACCT TAAAGAAGGC GACGTATTAT TAGTTGAAAA TACACGTTAT 2700 

GAAGATTTAG ACGGTAAAAA AGAATCTAAA AATGATCCAG AATTAGGTAA ATACTGGGCA 27 60 

TCTTTAGGTG ATGTGTTTGT AAATGATGCT TTTGGTACTG CGCAT CGTGA GCATGCATCT 2 820 

AATGTTGGTA TTTCTACACA TTTAGAAACT GCAGCTGGAT TCTTAATGGA TAAAGAAATT 2880 

AAGTTTATTG GCGGCGTAGT TAACGATCCA CATAAACCAG TTGTTGCTAT TTTAGGTGGA 294 0 

GCAAAAGTAT CTGACAAAAT TAATGTCATC AAAAACTTAG TTAACATAGC TGATAAAATT 3 000 

ATCATCGGCG GAGGTATGGC TTATACTTTC TTAAAAGCGC AAGGTAAAGA AATTGGTATT 3 060 

TCATTATTAG AAGAAGATAA AATCGACTTC GCAAAAGATT TATTAGAAAA ACATGGTGAT 3120 

AAAATTGTAT TACCAGTAGA CACTAAAGTT GCTAAAGAAT TTTCTAATGA TGCCAAAATC 3180 

ACTGTAGTAC CATCTGATTC AATTCCAGCA GACCAAGAAG GTATGGATAT TGGACCAAAC 3240 

ACTGTAAAAT TATTTG CAG A TGAATTAGAA GGTGCGCACA CTGTTGTATG GAATGGACCT 3300 

ATGGGTGTAT TCGAGTTCAG TAACTTTGCA CAAGGTACAA TTGGTGTATG TAAAGCAATT 3 3 60 
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TCTTTAGGTT TTGAAAATGA CTTCACTCAT ATTTCAACTG GTGGCGGCGC GTCATTAGAG 34 80 

TACCTAGAAG GTAAAGAATT GCCTGGTATC AAAGCAATCA ATAATAAATA ATAAAGTGAT 354 0 

AGTTTAAAGT GATGTGGCAT GTTTGTTTAA CATTGTTACG GGAAAACAGT CACAAGATGA 3 6 00 

CATCGTGTTT CATCACTTTT CAAAAATATT TACAAAACAA GGAGTGTCTT TAATGAGAAC 3 6 60 

ACCAATTATA GCTGGTAACT GGAAAATGAA CAAAACAGTA CAAGAAGCAA AAGatTCGTC 3 72 0 

AATACATTAC CAACACTACC AGATTCAAAA GAAGTAGAAT CAGTAATTTG TGCACCAGCA 3 7 80 

ATTCAATTAG ATGCATTAAC TACTGCAGTT AAAGAAGGAA AAGCACAAGG TTTAGAAATC 384 0 

GGTGCTCAAA ATACGTATTT CGAAGATAAT GGTGCGTTCA CAGGTGAAAC GTCTCCAGTT 3 9 00 

GCATTAGCAG ATTTAGGCGT TAAATACGTT GTTATCGGTC ATTCTGAACG TCGTGAATTA 39 60 

TTCCACGAAA CAGATGAAGA AATTAACAAA AAAGCGCACG CTATTTTCAA ACATGGAATG 4 02 0 

ACTCCAATTA TATGTGTTGG TGAAACAGAC GAAGAGCGTG AAAGTGGTAA AGCTAACGAT 4 0 80 

GTTGTAGGTG AGCAAGTTAA GAAAGCTGTT GCAGGTTTAT CTGAAGATCA ACTTAAATCA 414 0 

GTTGTAATTG CTTATGAACC AATCTGGGCA ATCGGAACTG GTAAATCATC AACAT CTGAA 420 0 

GATG CAAATG AAATGTGTGC ATTTGTACGT CAAACTATTG CTGACTTATC AAGCAAAGAA 426 0 

GTATCAGAAG CAACTCGTAT TCAATATGGT GGTAGTGTTA AACCTAACAA CATTAAAGAA 4 32 0 

TACATGGCAC AAACTGATAT TGATGGGGCA TTAGTAGGTG GCGCATCACT TAAAGTTGAA 43 80 

GATTTCGTAC AATTGTTAGA AGGTGCAAAA TAATCATGGC TAAGAAACCa ACTGCGTTAA 444 0 

TTATTTTAGA TGGTTTTGCG AACCG CGAAA GCGAACATGG TAATG CGGT A AAATTAGCAA 4 500 

ACAAGCCTAA TTTTGATCGT TATTACAACA AATATCCAAC GACTCAAATC GAAGCGAGTG 4 560 

GCTTAGATGT TGGACTACCT GAAGgACAAA TGGGTAACTC AGAAGTTGGT CATATGAATA 4 620 

TCGGTGCAGG ACGTATCGTT TATCAAAGTT TAACTCGAAT CAATAAATCA ATTGAAGACG 4 6 80 

GTGATTTCTT TGAAAATGAT GTTTTAAATA ATGCAATTGC ACACGTGAAT TCACATGATT 4740 

CAGCGTTACA CATCTTTGGT TTATTGTCTG ACGGTGGTGT A CACAG T CAT TACAAACATT 4 800 

TATTTGCTTT GTTAGAACTT GCTAAAAAAC AAGGTGTTGA AAAAGTTTAC GTACACGCAT 4 860 

TTTTAGATGG CCGTGACGTA GATCAAAAAT CCG CTTTGAA ATACATCGAA GAGACTGAAG 4 920 

CTAAATTCAA TGAATTAGGC ATTGGTCAAT TTGCATCTGT GTCTGGTCGT TATTATGCAA 4 980 

TGGAT CGTGA CAAACGTTGG GAACGTGAAG AAAAAGCTTA CAATGCTATT CGTAATTTTG 504 0 

ATGCCCCAAC TTATGCAACT GCCAAAGAAG GTGTAGAAGC AAGCTATAAT GAGGGCTTAA 5100 

CTGACGAATT CGTAGTACCA TTCATCGTTG AGAATCAAAA TGACGGTGTT AATGATGGAG 5160 
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CGAACAGAGC ATTCGAAGGC TTTAAAGTTG AACAAGTTAA AGACTTATTC TATGCAACAT 52 8 0 

TCACTAAGTA TAATGACAAT ATCGATGCGG CTATCGTCTT CGAAAAAGTT GATTTAAATA 534 0 

5 

ATACAATTGG TGAAATTGCA CAAAATAACA ATTTAACTCA ATTACG TATT GCAGAAACTG 54 0 0 

AAAAATACCC TCACGTTACT TACTTTATGA GTGGTGGACG TAACGAGGAA TTTAAAGGTG 54 6 0 

AACGCCGTCG TTTAATTGAT TCACCTAAAG TTGCAACGTA TGACTTGAAA CCAGAAATGA 552 0 

GTGCTTATGA AGTTAAAGAT GCATTATTAG AAGAGTTAAA TAAAGGTGAC TTGGACTTAA 558 0 

TTATTTTAAA CTTTGCTAAC CCTGATATGG TTGGACATAG TGGTATGCTT GAGCCGACAA 564 0 

(5 TCAAAGCAAT CGAAGCGGTT GATGAATGTT TAGGAGAAGT GGTTGATAAG ATTTTAGACA 57 00 

TGGACGGTTA TGCAATTATT ACTGCTGACC ATGGTAACTC TGAT CAAGTA TTGACGGaTG 5760 

ATGATCAACC AATGACTACG CAwACAACGA ACCCAGTACC AGTGATTGTA ACAAAAGAAG 5820 

20 GCGTTACACT TAGAGAAACT GGTCGCTTAG GTGACTTAGC ACCTACATTA TTAGATTTAT 5880 

TAAATGTAGA ACAACCTGAA GATATGACAG GTGAaTCTTT AATTAAACAC TAATATTGTA 594 0 

AAAGATGTTA AGTAAACGCT TAATGACACT TATTTTTTGA AAATAATAGT AATATCnTTT 6000 

25 TGTTAAATGA AAGAATAAAG CTATAATAAT TATAGAATAA CTATTTAn 604 8 

(2) INFORMATION FOR SEQ ID NO: 129: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 5602 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 129: 

AAAGAAGTGC AAGATATCAT CGCATTAATT AAGTCGTTAC AAAg TGTAAT TGTAGACaTC 60 

40 GCTTCCAATA ATGTTGATAC AATTATGCCT GGTTATACTC ATTTACAGCG TGCACAGCCA 12 0 

ATTTCATTTG CACATCATAT TATGACTTAT TTTTGGATGT TACAACGAGA CCAA CAACGA 180 

TTTGAAGATA GTTTAAAACG AATCGATATT AATCCTTTAG GTGCAGCAGC CTTAAGTGGT 24 0 

45 ACCACATACC CTATCGATAG ACACGAGACA ACAGCATTGT TGAACTTTGG CAGTCTCTAT 3 00 

GAG AATAG CC TAGATGCTGT TAGTGACAGA GACTATATTA TTGAAACATT GCATAATATT 3 60 

TCTTTAACGA TGGTTCACTT ATCACGCTTT GCAGAGGAAA TTATTTT CTG GTCCACAGAC 420 

so 

GAAGCTAAAT TCATTACATT ATCAGATGCA TTTTCAACTG GCTCATCTAT TATGCCACAA 4 80 

AAGAAAAATC CTGATATGGC AGAATTAATT AGAGGTAAAG TTGGTCGAAC GACTGGTCAT 54 0 
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GAAGATAAAG AAGGTTTATT 


CGATGCTGTC 


CATACAATTA 


AAGG TTCTTT 


ACGTATTTTC 


660 


GAAGGTATGA TTCAAACGAT 


GACAATTAAT 


AAAGAACGAC 


TCAATCAAAC 


TGTTAAAGAA 


720 


GATTTTTCAA ATGCAACGGA 


ACTAGCAGAT 


TATTTAGTAA 


CTAAAAATAT 


TCCATTTAGA 


760 


ACTGCACATG AAATTGTAGG AAAAATCGTC 


TTAGAATGTA 


TACAACAAGG 


TCATTATTTA 


840 


TTAGATGTTC CTTTAGCAAC 


ATATCAACAA 


CAT CATTCTA 


GTATTGATGC 


CGATATTTAC 


900 


GATTATTTGC AGCCTGAAAA 


TTGTTTAAAA 


CGACGTCAAA 


GTTACGGTTC 


AACAGGTCAA 


960 


TCATCGGTCA AACAACAACT 


TGATGTTGCT 


AAACAATTAC 


TATCACAATA 


AATACGTTAA 


1020 


TCTACCTACC CACAATGTCT 


ATTAAAATTA 


CATTGTGGGT 


ATTTTAATGC 


TCTCTTCGTC 


1080 


TTGTTGAACA TCACATTTTT 


AAGATTCCTA 


AAATGTTTGA TAATTCTTTT 


AAATTTATAT 


1140 


TACAAAAATG TTATAAATTG 


TAAAAGAAAT 


GTGTAAAGCG 


TTTTCACAAG 


CAGGTTTTTG 


1200 


TAGTATTTTA AAATTGTTAG 


ACTACAAATA 


AAGAGATGAA 


AGGATAAAGA 


CTATGACTAA 


1260 


CTCTTCGAAA AGCTTCACTA 


AATTTATGGC 


TGCTTCTGCT 


GTTTTTACTA 


TGGGATTTTT 


1320 


ATCAG TACCT ACTGCTGGCG 


CTGAACAAAC 


AAATCAAATT 


GCAAATAAAC 


CTCAGGCTAT 


1380 


TCAATGGCAT ACAAATTTAA 


CGAATGAGCG 


ATTCACTACT 


ATCGCACATC 


GTGGCGCAAG 


1440 


TGGCTATGCA CCCGAGCATA 


CGTTTCAAGC 


ATATGATAAG 


AGTCATAATG 


AGTTAAAAGC 


1500 


ATCTTATATC GAAATTGATT 


TACAACGTAC 


CAAAGATGGC 


CATTTAGTTG 


CTATGCATGA 


1560 


TGAAACTGTT AACCGTACAA 


CAAATGGACA 


CGGTAAAGTT 


GAGGATTATA 


CCCTTGATGA 


1620 


ATTAAAACAG TTAGATGCAG 


GAAG TTGGTT 


TAATAAAAAA 


TATCCAAAAT 


ACGCAAGAGC 


1680 


AAGTTATAAA AATGCTAAAG 


TACCCACTTT 


AGATGAAATT 


TTAGAACGTT 


ATGGCCCGAA 


1740 


TGCAAACTAT TATATTGAAA 


CAAAGTCACC 


TGATGTATAC 


CCAGGAATGG 


AAGAACAATT 


1800 


ATTAGCTTCA TTGAAAAAGC 


ATCACCTTTT 


AAATAACAAT 


AAATTAAAAA 


ATGGACATGT 


1860 


AATGATTCAA TCATTTTCTG 


ACGAAAGTTT 


AAAGAAAATT 


CATCGTCAAA 


ATAAGCATGT 


1920 


GCCATTAGTA AAATTAGTTG 


ATAAAGGTGA 


ACTACAACAA 


TTTAACGACC 


AACGCTTAAA 


1980 


AGAGATACGC TCTTATGCGA 


TTGGATTAGG 


TCCTGATTAT 


ACAGATTTAA 


CTGAACAAAA 


2040 


TACCCATCAT TTAAAAGACT TAGGATTTAT AGTACATCCT TATACAGTGA ATGAAAAAGC 


2100 


TGATATGTTA CGATTAAATA AATATGGCGT 


TGATGGTGTC 


TTTACAAATT 


TCGCTGATAA 


2160 


ATATAAAGAA GTCATTAAGT 


AGTAATGTTA 


AACTAGAAAA 


CATAAAT A CA 


AAAATATAGC 


2220 


TATTACTATA AAAAACAGCA 


GTAAGATATT 


TCCAAATTGA AATTATCCTA 


CTGCTGTCTT 


2280 


TTTGGGAGTG GGACAGAAAT 


GATATTTTCG 


CAAAATTTAT 


TTCGTCGTCC 


CACCCCAACT 


2340 
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TTGTCTGTAG AAATTGAGGA GCTAATTTCT CTGTGTCGGG GCTCCACCCC AACTTGCACA 24 6 0 

CTATTGTAAG CTGACTTTCC GCCAGCCTCT GTGTTGGGGC CCCGCCAACT TGCACACTAT 2 52 0 

TGTAAGCTGA CTTTCCACCA GCCTCTGTGT TGGGGCCCCG ACTATTTTTG AAAAGAGCGT 2580 

GTTACACGGG CATTGTTTTA CAGTCAACTA CTGCTAAAAT AAAATTAACG AGCTTAGGGC 264 0 

TTTGTTTTCT GTCCCAAGCT CGTTAAATCA CATATGATAA TTAATTATGC CCAACCACGA 27 0 0 

TATCTAGCTG CTTCTGCTGT ACGTTTAATA CCTATGATAT ATGCTGCAAG TCTCATATCT 276 0 

ATTTTTCGGT TTTGAGACAA TTCGTAAATC GTATCAAATG CCGCTTCTAA TTTTTCACGT 282 0 

AGCTTTTCAT TAACTTCTTC TTCAGACCAA TAATAACCTT GATTATTTTG TACCCATTCG 28 8 0 

AAGTAAGAAA CCGTtACACC ACCAGCACTT GCTAATACGT CTGGAACTAA TAATATACCA 294 0 

CGTTCAGTTA AAATACGTGT TGCTTCTGGT GTTGTAGGTC CATTAGCAGC TTCAACAACG 300 0 

ATACTAGCTT TAATATCATG TGCATTGTCT TCTGTAATTT GGTTTGAAAT AGCCGCTGGT 306 0 

ACTAAAATGT CACAATCTAA TTCAAACAAT TCTTTATTTG AGATTGTTTC TTCAAATAAA 3120 

TTTGTTACCG TACCAAAACT ATCACGACGG TCTAATAAAT AATCTATATC TAAGCCATTT 3180 

GGATCGTGTA ATGCAC CGTA AGCATCAGAG ATACCTACAA TTTTTGCACC TAAATCATAT 324 0 

AAGAATTTAG CTAAGAAACT TCCGGCATTA CCGAAACCTT G AATAACAA C CTTGGCACCT 3300 

TCAATTTGCA T ATT AC GACG TTTTGCAGCT TGTTCAATTG CAATAACTAC ACCTAGTGCA 336 0 

GTTGATCTGT CGCGTCCATG AGAACCACCC AATACAATTG GTTTACCTGT GATGAAACCT 342 0 

GGTGAATTAA ATTTATCTAA TGCACTATAT TCATCCATCA TCCAAGCCAT AATTT GTGAG 34 80 

TTTGTAAATA CATCTGGTGC TGGAATATCT TTGTTCGGAC CT AC GAATTG TGAAATTG CT 354 0 

CTTACATATC CGCGTGATAA ACGTTCAACT TCATGAATGC TCATTTGACG TGGATCACAA 360 0 

ACGATACCAC CCTTACCACC ACCGTATGGT AAGTTTACAA TGCCACATTT CAAAGTCATC 3660 

CACATTGATA ATGCTTTTAC TTCTTCTTCA TCAACATCTG GGTGGAAACG CACGCCCCCT 3720 

TTTGTTGGTC CAACAGCATC ATTATGTTGC GCACGGTAAC CTGTGAATGT TTTTACTGTG 3780 

CCATCATCCA TTCGTACAGG GATACGCACT TGTAACATTC TTAAAGGTTC TTTAATTAAA 384 0 

TCGTACATTC CTt CGTCAAA TCC CAATTTA TGCAATGCTT CTTTAATAAT TCCTTGAGTA 3 90 0 

GAAGTTACTA AATTATTGTT CTCAGTCATG ATCCTTTTCG CCTCTTCTTT ACCTAATGAT 396 0 

TTCGCTTTCA AACATATTGT AACATAACGT ATTCCTTTTT AAAGCCCTTA CAAACTGATT 4020 

GTTACAACTT TTTGACATTA TTGAAATACA TGTCTTATTT TTTCAAGTGC AAGGTCCAAT 4 0 80 

TCTTCTTTAG TAATAATTAA TGGTGGTGCA AAA CGAATG A CAGTATCATG CGTTTCTTTA 414 0 
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ACACCTATAA ACAAACCACG TCCACGGACT TCTTTAATTG ATGGATGATC AATTTGCTTT 42 60 

AATTGTTCTT TAAAATAATC TCCTAATTCT AAAGAGCGGC CTGGTAAATC CTCATCAACG 4 32 0 

ATAACATCTA ATGCAGCAAT TGATGCAGCA CAAGCAAGTG GATTACCACC AAATGTTGAA 43 8 0 

CCATGTGAGC CAGGTGTAAA GACAT CTAAT ACTTCTTTAT CTGCTAATAC AACAGAAATT 444 0 

GGGAAGACTC CACCACCTAG TGCTTTACCT AAAATATAGA CATCAGGTTT TACATTATCC 4 50 0 

CAATCCGTAG CAAATAATTT ACCCGAACGA CCTAATCCTG CTTGGATTTC GTCAGCAATA 4 56 0 

AATAAGACAT TATGTTCATC ACATAATTCT CTAATTGCTT TCAAATATCC TTCTGGCGGT 4 62 0 

ATATTTATAC CCGCTTCACC TTGAATTGGT TCTACTAAAA CTGCTG CAGT ATTTTCATTA 4 680 

ATTGCAGCTT TCAATGCATC TACATCTCCA AAATCAACTT TTCTAAATCC ATCTAATAAC 4 74 0 

GGACCATAAC CACGTTGGTA TTCTGCTTCT GAAGATAATG AAACTGGCGC CATTGTTCGA 4 800 

CCATGGAAGT TAC CATT AAA TGCAATGATT TCTGCTTTAT TTGGCTCAAT TCCTTTAACA 486 0 

TCGTATGCCC AGCGTCGTGC TGCTTTCAAA GCTGTTTCTA CTGCTTCAGC ACCTGTATTC 4 920 

ATTGGTAAAG CTTTATCTTT ACCTGCCAGT TTACAAATTT TTTCGTACCA TTCACCTAAG 4 98 0 

TTAT CACTAT GAAAAGCACG TGAAACTAAA GTCACTTTAT CAGCTTGATC TTTTAATGCT 504 0 

TGAATAATTT TCGGATGTCT ATGACCTTGG TTAACAG CGG AATATGCAGA TAACATATCC 5100 

ATATATTTAT TGC CTTCAGG ATCTTTAACC CATACCCCTT CAGCTTcTGa AATGaCAATT 5160 

GGcAATGGTA AATAATTATG TGCTC CGTAA TGATTTGTTA ACTCAATAAT TTTTTCAGAT 52 2 0 

TTAGTCATCA TATCTCCCCT TTTCATCATT TATAACTATT ATACATGAAA CATTATCCAA 52 80 

ATAATTACAT TAGTTTTCAA AGCAGATACT TTTCCACCAA AAAAGATGAA ATAATCACTA 534 0 

AGTTT CATT A AATTTGTCTA TTTTGAAAAC CCTTACATTT ATAATGACAT AATTACTTAA 54 00 

ATGaTTACAA GCAAAAGAAT TGATAATTTT ACACTTAATC AAAAGTATAT TTTACTAAGA 54 6 0 

ATATTTTTAT TTATAAATAT TGAAAACCAC TAACAAATTG CATACACAAT ATCATTAGTG 552 0 

GTAACAGTTA AACACTTATT TATCTTTACG GGGTAATGGG TTAAAACCCT TnCATTAAAA 55 8 0 

TTGGATGnCC ATAAAATTAG GG 56 02 
(2) INFORMATION FOR SEQ ID NO: 130: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5924 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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TAACCCCATT TTACCTGGAA AAATCgTTTG CGATGCaATm GCaTTtGaAT ATAaATACAT 6 0 

TTTACGTATa GAATTATAAA AgGTTTCATT CaAATCTTAG GGTCAAAAAT GTTATAATAT 120 
5 TTTTATGTCA AATl'TAAAAC AGTAACACTT ATTTACAAGG TTG CAATATT TTGAAGTAAT 180 

AAAGGAAGTG TCGCGTATTT TAACTTTTTC AGAGCAAAAT GCACTCGCGA AAATAGATGA 240 
TTTAATGAAT ACTTATTGCA ATCAATGTCC AATCAAAACT CGTCTGCGTA AATTAGAGGG 3 00 

10 

GAAAACGAAG GCGCATCATT TTTGTATCAA TGAGTGTTCA ATAGGGAAAG AAATAAAACA 3 60 

ATTAGGAAAT GAACTTCAAT AGGAGGAAGT CAAATGAAAA TTATATCTAT ATCAGAAACA 4 20 

JS CCGAACCACA ACACAATGAA GATTACACTT AGTGAAAGCA GAGAAGGTAT GACAT CAG AT 4 80 

ACGTATACTA AAGTTGATGA TTCACAGCCA GCATTTATTA ATGACAT CTT AAAGGTTGAA 54 0 

GGCGTTAAAT CAATTTTCCA TGTTATGGAC TTTATTTCAG TAGATAAAGA AAATGACGCA 6 00 

20 AATTGGGAAA CAGTATTGCC AAAAGTAGAG GCTGTATTCG AATAAATTTT TCATCAACTA 660 

GTATTCGGGG GGAATAAAGT ATATGGAAAT TTTACGTATA GAGCCAACAC CAAGTCCAAA 72 0 

TACAATGAAA GTTGTTTTGT CATATACAAG AGAAGACAAG TTATCTAATA CTTATAAAAA 780 

25 AGTAGAAGAA ACACAACCAA GATTTATAAA TCAGTTGTTA TCTATAGATG GTATCACTTC 84 0 

CATTTTTCAT GTCATGAACT TCTTAGCTGT TGATAAGG CA CCAAAAGCTG ATTGGGAAGT 90 0 

CATATTACCT GATATTAAAG CTGCTTTTTC TGATG CGAAT AAGGTTTTAG AAT CTGTAAA 96 0 

30 

TGAACCTCAA ATTGACAATC ATTTTGGTGA AATTAAAGCT GAATTATTAA CTTTTAAGGG 1020 

TATACCGTAT CAAATTAAGC TAACTTCTGC TGACCAAGAA TTAAGAGAAC AATTACCACA 10 8 0 

AACATATGTT GAC CAT ATGA CTCAAGCGCA AACAGCACAT GACAATATTG TTTTTATGCG 114 0 

35 

TAAATGG CTA GATTTAGGAA AT CGCTATGG AAATATTCAA GAAGTAATGG ATGGTGTCCT 12 0 0 

AGAAGAAGTG CTAGCTACCT ATCCAGAATC ACAGTTACCC GTATTGGTAA AACATGCTTT 126 0 

40 AGAAGAAAAT CACGCAACTA ATAATTATCA TTTCTATCGA CATGTCTCTT TGGATGAATA 132 0 

TCATGCAACT GATAATTGGA AGACTCGATT ACGAATGTTA AACCATTTTC CAAAGC CGAC 138 0 

TTTTGAAGAT ATACCGCTGC TTGATTTAGC TTTATCTGAT GAAAAAGTAC CGGTTAGACG 144 0 

45 TCAAGCGATT GTATTATTAG GTATGATTGA AAGTAAAGAA ATTTTACCGT ATTTATATAA 150 0 

GGGGCTTCGT GATAAAAGTC CTGCTGTAAG AAGAACAGCA GGGGATTGCA TAAGCGATTT 156 0 

AGGGTATCCA GAGGCACTAC CAGAAATGGT GCTACTATTA GATGATCCAC AGAAAATCGT 162 0 

50 

TAGGTGGCGT GCTGCTATGT TTATCTTTGA TGAAGGTAAT GCAGAGCAGC TTCCCGCACT 168 0 

AAAAGCCCAT ATTAATGACA ATGCGTTTGA AGTTAAATTA CAAATTGAAA TGGC CATATC 174 0 
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AATTTAATTG GAGGAATTAA ATATGAATGC ATATGATGCT TATATGAAAG AAATTGCGCA i860 

ACAAATGCGT GGCGAATTAA CTCAAAATGG TTTTACAAGT TTAGAAACGA GCGAACAGct 1920 

ATCGGAGTAT ATGAACCAAG TAAAT GCTGA TGACACTACT TTTGTAGTTA TTAACTCTAC 1980 

ATGCGGCTGT GCAGCTGGAT TAGCAAGACC AGCTGCAGTA GCAGTTGCAA CACAAAATGA 2 04 0 

ACATAGACCT ACAAATACAG TTACAGTTTT TGCTGGGCAA GATAAAGAAG CAACTGCTAC 210 0 

AATGCGAGAA TTCATTCAGC AAGCACCATC TAGTCCTTCG TATGCTTTAT TCAAAGGTCA 216 0 

AGATTTAGTT TATTTTATGC CTAGAGAATT TATCGAAGGT AGAGATATTA ATGACATTGC 222 0 

AATGGACTTA AAGGATGCCT TTGACGAAAA TTGTAAATAG TACACATAAA TAAATATAAA 22 80 

GGTTAACACA TTTTATAATA TTAAAAATGG TGTCTGTCAT TGAAAATAGA GAATATAGTT 2 34 0 

GTATTCTATT TGTTAAATAA AGTCCGTTTT TACCaACTAT ATTTTCTAGA AATTTAACTG 24 00 

TTTTAATAGG ACATCAAACA TAATATT CaA ATCaTGTGTT AACCTCTTTT TTAAAATTTT 2460 

TTAGCATTAA AGTTATAGAT TTGGGTAAAC AATTACCAAT TGGAAACATA TATCACGTTA 2520 

CGATGGGGTA GGTACTTAAT CAGCATTTTA TAAATAAAGT AACGGAATTC ATGATATTAA 2 58 0 

TATCATATTC CTAAAATGAG TGATAA CAAA ATG CTACATA AAGTTAAGTT ATATCAAACT 264 0 

AAATATACAT ACTATAAATA ATGAAAATGA GGTGTTATCG CATATGTTGA ATTCATTTGA 2 700 

TGCAGCATAT CACAGTCTTT GTGAAGAAGT TTTAGAAATA GGAAATACAC GAAATGATCG 2760 

CACAAATACA GGTACGATTT CGAAATTTGG TCATCAACTT CGCTTTGACT TATCTAAAGG 2 82 0 

ATTTCCACTA TTAACGACAA AGAAAGTTTC TTTTAAATTA GTAGCAACCG AATTATTATG 2 8 80 

GTTCATTAAA GGAGATACAA ACATCCAATA CTTATTAAAA TATAATAATA ATATATGGAA 2 94 0 

CGAATGGGCT TTTGAAAATT ATATCAAATC AGACGAGTAT AAAGGTCCAG ATATGACAGA 3 000 

TTTCGGGCAT CGTGCATTGA GTGATCCTGA ATTTAACGAA CAATATAAAG AACAAATGAA 3 060 

ACAATTTAAG CAACGTATTC TTGAAGATGA TACATTTGCG AAGCAATTCG GGGATTTAGG 3120 

AAATGTTTAT GGTAAACAAT GGCGAGATTG GGTTGATAAA GATGGTAATC ATTTTGATCA 3180 

ACTTAAAACA GTAATTGAAC AAATTAAGCA TAATCCAGAT TCAAGGCGAC ACATCGTATC 3 240 

TGCATGGAAT CCAACAGAAA TTGATACAAT GGCACTTCCG CCTTGTCATA CCATGTTCCA 33 00 

GTTTTATGTC CAAGATGGTA AGTTAAGTTG CCAGTTATAC CAACGTAGCG CAGATATCTT 33 60 

TTTAGGTGTG CCATTTAATA TCcGCagctA CGCTTTATTG ACACACCTTA TTGCCAAAGA 342 0 

ATGTGGACTT GAAGTGGGTG AATTTGTGCA TACATTTGGA GATGCACATA TTT ATT CAAA 34 8 0 

TCATATTGAT GCGATTCAAA CACAATTAGC ACGTGAAAGC TTCAATCCTC CAACATTAAA 354 0 
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TGAATCACAT CCAGCAATAA AAGCTCCAAT AGCAGTGTAG TCATTGCATA GTTAGCTAAC 3 66 0 

CATATAGACA TCAAAATGAC AT CATAGTAT TTTCAAGTGC AAAAAAGTAC TTTTTTGTGT 3 72 0 

TAAACGTTTT CATAAATTAT GCAAAATCAT TATTTCTATC ACACTTTATG ATAAAAATTG 378 0 

TGTTAAATTA AAGATAACTT AGTAATAAAA AATGAAATGA TAGAAGAAGG AGGATAATTA 3 84 0 

TGACTTTATC CATTCTAGTt GCACATGACT TGCAACGAGT AATTGGTTTt GAAAATCAAT 3 900 

TACCTTGGcA CCTACCAAAT GATTTGAAGC ATGTTAAAAA ATTATCAACA GGTCATACTT 3 960 

TAGTAATGGG TCGTAAGACA TTTGAATCGA TTGGTAAACC ACTAC CGAAT CGTCGAAATG 4 020 

TTGTACTTAC TTCAGATACA AGTTTCAACG TAGAnGGCGT TGATGTAATT CACT CTATTG 4 080 

AAGATATTTA CCAACTACCG GGCCATGTTT TCATATTTGG AGGGCAAACA TTATTTGAAG 414 0 

AAATGATTGA TAAAGTGGAC GACATGTATA TTACTGTTAT TGAAGGTAAA TTCCGTGGTG 4 200 

ATACGTTCTT TCCACCTTAT mCATTkGAgr CTGGGAAGTT GCCTCTTCAG TTGAAGGTAA 4 2 60 

ACTAGATGAG AAAAATACAA TTCCACATAC CTTTCTACAT TTAATTCGTA AAAAATAAGG 4 320 

GGGAAAACGA CCATGACAAA ACAGATTATA GTAACAGACT CAACATCCGA TTT AT CTAAA 4 3 80 

GAATACTTAG AAGCAAACAA CATTCATGTA ATTCCTTTAA GTTTAACTAT TGAAGGAGCT 444 0 

TCATACGTTG ACCAAGTAGA TATTA CATCA GAAGAATTTA TTAATCATAT TGAAAATGAT 4 5 00 

GAAGATGTAA AGACAAGTCA GCCAGCCATA GGTGAATTTA TATCTGCTTA TGAAGAACTA 4 560 

GGAAAAGATG GCTCTGAAAT CATAAGTATT CATCTTTCTT CAGGATTAAG TGGTACATAT 4 620 

AACACTGCTT ACCAAGCAAG TCAAATGGTA GATGCTAATG TAACTGTTAT TGATTCAAAA 46 80 

TCTATTTCTT TTGGTTTAGG GTATCAAATA CAACACCTAG TAGAGCTTGT AAAAgAaGGT 474 0 

GtCTCAACTT CTGAAATAGT TAAAAAGTTA AATCATTTAA GAGAAAACAT TAAATTATTT 480 0 

GTAGTTATAG GGCAATTGAA TCAATTAATT AAAGGTGGCA GAATTAGTAA AACAAAAGGT 4 86 0 

TTGATTGGTA AT CTTATGAA AATTAAACCA ATTGGTACAC TAGATGATGG TCG CTTAGAG 4 92 0 

CTTGTGCTTlCA ATGCGAGAAC TCaAAATTCk AGTATCCAAT ACTTGAAAAA GGAAATTGCT 4 980 

GAATTTATAG GAGATCATGA AATCAAATCC ATTGGTGTCG CACATGCTAA CGTCATTGAA 504 0 

TATGTTGATA AATTGAAGAA AGTTTTTAAT GAAGCTTTTC ATGTGAATAA TTACGATATA 510 0 

AATGTAACTA CACCAGTTAT TTCTGCACAT ACTGGTCAAG GTGCGATTGG CCTCGTAGTC 516 0 

CTTAAGAAGT AAATTTAATC TTTT CAGTGT TAATTACTTC CATTTCAATC CTTTATAGAC 522 0 

TAAATTTATA ATTAGATAGA TAGAGGAGGT AATTCATATG ACAAAAGAAT ATGCAACATT 52 80 

AGCAGGAGGA TGTTTCTGGT GCATGGTTAA ACCATTTACA TCATATC CAG GCATCAAGTC 534 0 
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GAATCAAACC GGCCATGTCG AAGCAGTACA AATTACGTTT GATCCAGAGG TTACTTCCTT 54 60 

TGAAAATATA TTAGACATAT ATTTCAAAAC ATTTGACCCA ACTGATGATC AAGGGCAATT 5 52 0 

TTTCGATAGA GGCGAAAGCT AT CAA CCAGT CATTTTCTAT CATGATGAAC ATCAGAAAAA 55 80 

GGCTGCTGAG TTTAAAAAGC AACAATTAAA TGAACAAGGT ATTTTCAAGA AAC CAGTGAT 564 0 

TACACCTATT AAAC CATATA AAAATTTCTA TCCAGCTGAA GACTACCATC AAGATTATTA 57 0 0 

CAAAAAGAAC CCGGTACATT ATTACCAATA TCAACGTGGT TCAGGTAGAA AAGCGTTTAT 57 6 0 

AGAATCACAT TGGGGGAATC AAAATGCTTA AAAAAGATAA AAG TGAACT A ACAGATATAG 58 2 0 

AATATATTGT TACACAAGAn AACGGCACTG AACCACCATT TATGAATGAA TATTGGAATC 58 8 0 

ATTTTGCTAA AGGATTTATG TAGATAAAnT TCnGGTAAAC CTTG 5924 



(2) INFORMATION FOR SEQ ID NO: 131: 

2° (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 92 80 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 131: 

GGCCGTTnAA AATCTCCAAA ATAnAAAAAC CCATCTTGTT CCAATGTTTT AAAATCGCCa 6 0 

30 

TCCaACACTT GaTCaATAGC TTGCAACAAC GTTGAACGTG TTTTaCCAAA AGCATCaAAC 12 0 

GCTCCCACTA AAATCAGTGC TTCAAGTAAC TTT CTCGTTT TGACTCTCTT CGGTATACGT 180 

3s CTAGCAAAAT CAAAGAAATC TTTAAATTTG CCGTTCTGAT AACGTTCATC AACAATCACT 24 0 

TTCACACTTT GATAACCAAC ACCTTTAATT GTACCAATTG ATAAATAAAT GCCTTCTTGG 30 0 

GAAGGTTTAT AAAACCAATG ACTTTCGTTA ATGTTCGGTG GCAATATAGT GATACCTTGT 36 0 

40 TTTTTTGCTT CTT CT AT CAT TTGAG CAGTT TTCTTCTCAC TTCCAATAAC ATTA CTT AAA 42 0 

ATATTTGCGT AAAAATAATT TGGATAATGG ACTTTTAAAA AGCTCATAAT GTATGCAATT 48 0 

TTAGAATAGC TGACAGCATG TGCTCTAGGA AAA CCATAAT CAGCAAATTT CAGAATCAAA 54 0 

45 TCAAATATTT G CTTACT AAT GTCTTCGTGA TAACCATTTT GCTTTGCACC TTCTATAAAA 60 0 

TGTTGACGCT CACTTTCAAG AACAGCTCTA TTTTTTTTAC TCATTGCTCT TCTTAAAATA 66 0 

TCCGCTTCAC CATAA CTGAA GTTTGCAAAT GTGCTCGCTA TTTGCATAAT TTGCTCTTGA 72 0 

SO 

TAAATAATAA CACCGTAAGT ATTTTTTAAT ATAGGTTCTA AATGCGGATG TAAATATTGA 78 0 

ACTTTGCTTG GATCATGTCT TCTTGTAATG TAAGTTGGAA TTTCTTCCAT TGGACCTGGT 84 0 

ss 
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ACACTTCTTA CACCGTCAGA CTCTAATTGG AATATGCCAG TCGTATCTCC TTGCGACAAC 96 0 

AATTCAAACA CTTTTTGATC ATCAAACGGA ATCTTTTCGA TATCAATATT AATACCTAAA 102 0 

TCTTTTTTGA CTTGTGTTAA GATTTGATGA ATAATCGATA AGTTTCTCAA CCCTAGAAAA 10 80 

TCTATTTTTA ATAACCCAAT ACGTTCGGCT TCAGT CATTG TCCATTGCGT TAATAATCCT 114 0 

GTATCCCCTT TCGTTAAAGG GGCATATTCA TATAATGGAT GGTCATTAAT AATAATTCCT 12 00 

GCCGCATGTG TAGATGTATG TCTTGGTAAA CCTTCTAACT TTTTACAAAT ACTGAAC CAG 12 60 

CGTTCATGTC GATGGTTTCG ATG TACAAAC TCTTTAAAAT CGTCAATTTG ATATGCTTCA 132 0 

TCAAGTGTAA TTCCTAATTT ATGTGGGATT AAACTTGAAA TTTCATTTAA TGTAACTTCA 13 80 

TCAAACCCCA TAATTCTTCC AACATCTCTA GCAACTGCTC TTGCAAGCAG ATGACCGAAA 144 0 

GTCACAATTC CAGATACATG TAGCTCGCCA TATTTTTCTT GGACGTACTG AATGAC CCTT 1500 

TCTCGGCGTG TAT CTTCAAA GTCAATATCA ATATCAGGCA TTGTTACACG TTCTGGGTTT 156 0 

AAAAAAGGTT CAAATAATAG ATTGAATTTA ATAGGATCAA TCGTTGTAAT TCCCAATAAA 162 0 

TAACTGACCA GTGAG CCAGC TGAAGAACCA CGACCAGGAC CTACCATCAC ATCATTCGTT 1680 

TTCGCATAAT GGATTAAATC ACTTACTATT AAGAAATAAT CTTCAAAACC CATATTAGTA 174 0 

ATAACTTTAT ACTCATATTT CAATCGCTCT AAATAGACGT CATAATTAAG TTCTAATTTT 180 0 

TTCAATTGTG TAACTAAGAC ACGCCACAAA TATTTTTTAG CTGATTCATC ATTAGGTGTC 1860 

TCATATTGAG GAAGTAGAGA TTGATGATAT TTTAATTCTG CATCACACTT TTGAGCTATA 192 0 

ACATCAACCT GCGTTAAATA TTCTTGGTTA ATATCTAATT GATTAATTTC CTTTTCAGTT 1980 

AAAAAATGTG CACCAAAATC TTCTTGATCA TGAATTAAGT CTAATTTTGT ATTGTCTCTA 204 0 

ATAGCTGCTA ATGCAGAAAT CGTATCGGCA TCTTGACGTG TTTGGTAACA AACATtTTGA 210 0 

ATCCAAACAT GTTTTCTACC TTGAAT CGAA ATACTAAGGT GGTCCATATA TGTGTCATTA 2160 

TGGGTTTCAA ACACTTGTAC AATATCACGA TGTTGATCAC CGACTTTTTT AAAAATGATA 2220 

ATCATATTGT TAGAAAATCG TTTTAATAAT TCAAACGACA CATGTTCTAA TGCATTCATT 2280 

TTTATTTCCG ATGATAGTTG ATACAAATCT TTTAATCCAT CATTATTTT T AG CTAGAACA 2340 

ACTGTTTCGA CTGTATTTAA TCCATTTGTC A CATATATTG TCATACCAAA AATCGGTTTA 24 00 

ATGTTATTTG CTATACATGC ATCATAAAAT TTAGGAAAAC CATACAATAC ATTGGTGTCA 246 0 

GTTATGGCAA GTGCATCAAC ATTTTCAGAC ACAGCAAGTC TTACgGCATC TTCTATTTTT 2520 

AAGCTTGAAT TTAACAAATC ATAAGC CGTA TGAATATTTA AATATGCCAC CATGATTGAA 2580 

TGGCCCCTTT CTATTAGTTA AGTTTTGTGC GTAAAGCTGT AGCAAGTTGC TCAAATTCAT 2 64 0 
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CAATATCATT AATAATCAAT TGCCCTTTAG AACGTAATCG ACATCTGATT TCATTACCTT 2 76 0 

CATCGACTGC AAATACCCAT ATTTTCAAGC CTTTGATGTC AGCAATTGTA TTAACAAACT 282 0 

GAGATGCTTC ATTTGGCTGA ATACCGAATT GCTCCAATAC ATCTTCAGTT ATTTTAA CTT 2 8 80 

GGCAGAATCC ATCATCCATA AGTTCGAAAT GTTGTAAAAC ATAA CCTTGA AACGGCAACA 2 94 0 

TTTTTGGGTC CTTCTCCATC ATTTTATTTA AAAGCGCATT ATGATCAATA TCATGCCCAA 3 000 

TTAACTTTCC AGCAATTTCC ATAGTATGTT CTGAGGTATT GTTAAAAAGG AATCGCCCAG 3060 

TATCACCGAC GATACCAAGA TATAAAACGC TCGCGATATC TTTATTAACA ATTGCTTCAT 312 0 

CATTAAAATG TGAGATTAAA TCGTAAATGA TTTCACTTGT AGATGACGCG TTCGTATTAA 3180 

CTAAATTAAT ATCAC CATAC TGATCAACTG CAGGATGATG ATCTATTTTA ATAAGTTTAC 324 0 

GACCTGTACT ATAACGTTCA TCGTCAATTC GTGGAGCATT GGCAGTATCA CATACAATTA 33 0 0 

CAAGCGCATC TTGATATGTT TTATCAT CAA TGTTATCTAA CTCTCCAATA AAACTTAATG 33 6 0 

ATGATTCCGC TTCACCCACT GCAAATACTT GCTTTTGCGG AAATTTCTGC TGAATATAGT 34 2 0 

ATTTTAAACC AAGTTGTGAA CCATATG CAT CAGGATCTGG TCTAACATGT CTGTGTATAA 34 8 0 

TAATTGTATC GTTGTCTTCG ATACATTTCA TAATTTCATT CAAAGTACTA ATCATTTTCA 354 0 

TACTCCCTTT TTTAGAAAAG TTGCTTAATT TAAGCATTAG TCTATATCAA AATATCTAAA 360 0 

TTATAAAAAT TGTTACTACC ATATTAAACT ATTTGCCCGT TTTAATTATT TAGATATATA 366 0 

TATTTTCATA CTATTTAGTT CAGGGGCCCC AACACAGAGA AATTGG AC CC CTAATTT CTA 3 72 0 

CAAACAATGC aAGTTGGGGT GGGGCCCCAA CGTTTGTGCG AAATCTAT CT TATGCCTATT 3 780 

TTCTCTGCTA AGTTCCTATA CTTCGTCAAA CATTTGGCAT ATCACGAGAG CGCTCGCTAC 384 0 

TTTGTCGTTT TGACTATGCA TGTTCACTTC TATTTTGGCG AAGTTTCTTC CGACGTCTAG 3 90 0 

TATGCCAAAG CGCACTGTTA TATGTGATTC AATAGGTACT GTTTTAATAT ACACGATATT 396 0 

TAAGTTCTCT ATCATGACAT TACCTTTTTT AAATTTACGC ATTTCATATT GTATTGTTTC 402 0 

TTCTATAATA CTTACAAATG CCGCTTTACT TACTGTTCCG TAATGATTGA TTAAAAGTGG 4 08 0 

TGAAACTTCT ACTGTAATTC CATCTTGATT CATTGTTATA TATTTGG CGA TTTGATCGTT 414 0 

AATTGTTTCA CCCATCTGAG GCTGTCTTCC TAAAAGTTGC ATAGACTTTA AAACATCTTG 4200 

TCTATTAATC ACACCCACTG TCTTTTTATT ACTCGAAACG ACAGGAATCA ATTCAATACC 4 26 0 

TTCCCAAATC ATCATATG CG CACAACTTGC TACTGTACTC ATAGCATTTA CATAAATAGG 4 320 

ATTTCGCGTC ATCACTTTAT CTATTTCGTC GTCGTCCTTT GTATTAATCA TCTCTCGACT 4380 

TGTTACAATA CCTACTAATT TATACGACTC ATTGACTACC GGAAATCTTG TATGGCCAGT 444 0 
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ATCTAATGGC GTCATTATAT CTTGAACTAT TAAGATATCT TTTCGTATTT TCTGATTAAA 4 560 

AAGTG CTTTG TTGATAATAT TTGCAACTAG GAATGTATCA TAACTTGATG ATAGAACAGG 4 62 0 

s TAAATCATGT TCATTCGCAA AATTAATAAC TTTATTAGAT GGCTTAAATC CACCAGTAAT 4 6 80 

TAATATAGCC GTACCTCTTT TTAAAGCTTC AATCTGCACA TCTTCACGAT TTCCGACAAT 4 740 

CAATAATGTC TTTGGACCAA TATA CTTT AA AATATCTTTG AGTTCCATTG CTCCAATTGC 4 8 00 

10 AAATTTAGAT ACCATCTTAG TGATA C CTTT GTTGCCACCT AACACTTGGC CATCAATAAT 4 86 0 

ATTGACAATT TCATTAAAAG TTAAATGTTC AATTTCATTA CGATTACGTT TTTCGATTCG 4 92 0 

AACCGTACCA ACACGATCTA TCGTTGCGAC CATGCCCATT TTATCAGCAT CTTTmATTGc 4 980 

15 

ACGATATGCT GTCCCytCaG ATACGTTTAA AAATTTAGCG ATTTTAC GCA CCGAAATTTT 5 04 0 

AGAGCCTATA GATAACGATT CAATATAATC TAAAATTTGT T CATGTTTTG TCATTCTTTA 5100 

CCTCTTCTTT TCGAACAGTA TTAACTACAT TATAACTTTA TTTTGGATAA AAAGCATTGA 516 0 

20 

AGTGAAATGA AATAATGATC GTTtCACCTA TTTTATTTTT TGAAAATATA CAACAAACAC 5220 

AAAGATCACA AAATCTTTAA TTTTAAATGG AAAAATCCAT TATTATTTAT TAGAATGTAA 5 2 80 

2£ GTGAGGAGGG ATGTACTAAT GTATAAAAAT ATATTACTTG GTGTAGACAC TCAGTTAAAA 534 0 

AATGAAAAAG CACTAAAAGA AGTGTCTAAA TTAGCTGGCG AAGGTACAGT CGTAACAGTT 54 00 

TTAAACGCAA TCAGCGAACA AGaTGCTCAA GCATCAATTA AAGCAGGTGT TCATTTAAAC 54 6 0 

30 AAACTTACTG AAGAACGAAG CAAGCGATTG GAAAAAACAC GCAAAGCTTT AGAAGATTAT 5 52 0 

GGTATTGAT T ATGACCAAAT AATTGTTCGT GGTAATGCAA AAGAAGAACT ATTAAAACAT 5 580 

GCTAATAGCG GTAAATATGA AATTGTTGTT TTAAGTAACC GTAAAGCAGA AGACAAAAAG 564 0 

35 AAATTTGTAC TTGGAAGTGT CAGCCACAAA GTAGCAAAAC GTGCGACTAT CCCTGTATTA 570 0 

ATCQTTAAAT AAAATTTTTA TCCAGAATCA CAAATAATCT TTCAATCATG ATGCAGTCTC 576 0 

AAACGACTGA GTAAATACAA GAAACGATTA TGACTGTGGT TCTGGATTTT TTATATCGTA 5820 

40 

GTAAATTTAT AATCAATGTC TAATTGTATA AAACTAAAAT TACGAGAGTA GGTCAGAAAT 588 0 

GATAAAGAAC CACTGATGTC CCCCGTCCAC GTCGTAACTG AATCAGTAGA ATATAAAAAC 594 0 

ACCCACTAAA AATATG CAGA CGATAACTTC CACATAGATT AGCGAGGTGT TTTTTAGTGT 600 0 

45 

AAAATCTATA TTCTATTTAA AACTGAACAG ATTCACCTGG TTTTAAAATT TGCACGTCCC 6 06 0 

CTACATTAAC AGCATCTTTA AATTGTTGTG GATCTTGTTC GATTAATGGG AATGTATCAT 612 0 

so AATGAATCGG TACAGAAATT TTTGGTTTAA TAAATTCATT AATAGCATAA CTTGCATCAT 618 0 

CAATACCCAT CGTAAAATTA TCTCCAATTG GTACAAAACA TACATCAACT GGATGACGTT 624 0 
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TTCAACTTCA AACACGATAC CCATTGGCAT ACCTAAATAA ACTGGgAATA CCATTTTCAT 63 60 

GTGTAAAACT TGAACTATGA AATGCTTGAA CAAATTTAAC GCTTCCGAAA TCAAaGTTTG 64 20 

5 CTTTACCACC Aa TATTCATA CCATGAACAT TTTCAACACC GTGATATGAA GAAAGATAGT 6 48 0 

CAGCCATTTC TGCACTTCCA ATTACTGTTG CTCCTGTTTT CTTTG CTAGT TCCACAACAT 6 54 0 

CACCAAAATG ATCAAAATGA CCGTGCGTTA AAACGATATA GTCTACCTGC ACTGTTTCAA 6 60 0 

w 

TATTCAAATC ACACTTAGGG TTATTTGAAA TAAACGGATC TACGATAACC TTTTTGTTGT 666 0 

TCCCTTCTAA ATAAATCGTT GATTGACCAT GAAATGATAA CTTCATTTGA GCATCCTCCT 6 72 0 

ATCAATTA CT ATATAAATTT AGTACCCTTT TG CCACTTAA TTATAACAAA TTCTCAAATT 678 0 

15 

TTAAAAATTG AAAAT CTAGT TAATGTATTA GCTCGATTTT GAAATCTAAT AATAATTGGC 684 0 

ATAAAATGGA AGTAATATTA TGTTGAGGAG TGTTTATAAA ATGACAAAAA TATCAAAAAT 6 900 

2Q AATAGACGAA TTGAACAATC AACAAGCTGA TGCAGCATGG ATTACAACAC CGTTGAATGT 6960 

ATATTATTTT ACTGGATACC GTAGCGAACC CCATGAAAGA TTATTTGCAT TATTGATTAA 7020 

GAAAGATGGT AAACAAGTAC TATTTTGTCC AAAAATGGAA GTCGAAGAAG TCAAAGCATC 7080 

25 ACCTTTCACA GGTGAAATCG TTGGATATTT AGACACTGAA AACCCTTTTT CACTTTATCC 714 0 

TCAAACAATC AATAAATTAC TAATTGAAAG CGAGCACTTA ACAGTAGCAC GCCAAAAACA 7200 

ATTAATCTCT GGTTTCAATG TCAATTCATT CGGAGATGTT GATTTAACAA TCAAACAATT 72 60 

30 GAGAAATATT AAATCCGAAG ATGAAATTAG CAAAATACGT AAAGCTGCTG AGTTAGCAGA 73 2 0 

TAAGTGTATC GAAATAGGTG TTT CTTATTT AAAAGAAGGT GTGACTGAAT GTGAAGTAGT 73 80 

CAACCATATT GAGCAAACTA TCAAACAATA TGGCGTCAAT GAAATGAGTT TTGATACGAT 744 0 

35 GGTTTTATTT GGAGATCATG CCGCATCACC TCATGGCACA CCAGGAGATC G CAG ATT AAA 750 0 

AAGCAATGAA TATGTACTAT TTGATTTAGG TGTAATTTAT GAGCATTATT GTAGCGATAT 7 56 0 

GACACGTACT ATTAAATTTG GTGAAC CTAG CAAAGAAGCA CAAGAAATTT ATAATATTGT 7620 

40 

ATTAGAAGCA GAAACATCTG CAATCCAAGC AATTAAACCT GGAATACCAT TAAAAGATAT 76 80 

CGATCATATC GCTAGAAATA TTATTTCAGA AAAAGGTTAT GGTGAATATT TCCCTCATCG 7 74 0 

4S CTTAGGTCAT GGCCTAGGAT TACAAGAACA TGAATATCAA GATGTTTCAA GTACTAATTC 7 8 00 

TAATTTGTTA GAAGCTGGCA TGGTTATTAC AATCGAACCA GGTATTTATG TACCTGGTGT 7 86 0 

TGCAGGTGTA AGAATTGAAG ATGACATACT TGTCACTAAT GAAGGATATG AAGTATTAAC 7 92 0 

SO ACATTACGAA AAATAAGGAG TGGGATAAAA ATGAAAAGCT TGTTACAAGC GCATTCTCAT 7980 

TCAGTCAAAC ACTGCCAATA TAACATTGTA GCGCCTAAGA CATAAATTTT TATCCAAGTC 804 0 

55 
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TGTAATGAAT CAAATCAATA TCATTCATGT TCGATGATTT CTTCGCATTG TTTCTAGCTT 8160 

TAATTTATCA TTATTTAATT TTAATAA CCA AGGAGATGAT AACGTCATTC TTTAGTACGC 82 2 0 

TGTAATCCAT TCCCTTTTCA TCAAATTCAA ATTATAATTG TAATGCTTCT TCTACAGATT 82 BO 

TATATTCCAT TTCAAATGCC TCTGCAACGC CTTTATTGGT TACGTGACCT TTGTAAGTAT 834 0 

TTAAACCTAA TGATAATGGT TGATTTGATT TAAATGCTTC TCTATACCCT TTATTAG CTA 84 0 0 

GCATGAGCGC ATAAGGTAGC GTAg CATTAT TTAAAGCTAA CGTCGAAGTA CGCGGTACTG 846 0 

CACCTGGCAT ATTTGCAACT GCATAATGAA CCACACCATG CTTAATATAT GTAGGAT CAT 8 52 0 

CATGTGTCGT AATTTTATCA GTTGtTTCAA AAATACCGCC TTGATCAATA GCAATGTCAA 8580 

TAATAACTGA CCCATTTTTC ATTTGTTTAA TCATGTCTTC TGTTACAAGT CTTGGCGCTT 864 0 

TAGCACCTGG AATTAAAACT GCACCTATTA CTAAATCACT TTGTTTAACA TACAACTCAA 8700 

TATTCAACGG ATTTGACATA ATTGTATGTA CACGTCCACC GAATAAATCA TCTAATTGTT 876 0 

GTAAACGCTT TGGATTAACA TCTAAAATCG TAACATCTGC ACCTAGTCCT AGTGCAATTT 8 82 0 

TAGCTGCATT TGTTCCTGCT TGACCACCAC CGATAATAGT TACTTTACCC TTAGGTACTC 8880 

CTGGGACACC ACCTAGTAGA ATTCCCATAC CACCATTAAG TTTTTGTAGG AACTCTGCGC 894 0 

CAACTTGAGC TGACATTCTT CCTGCTACCT CACTCATTGG TGATAACAAT GGTAAAGATC 9000 

GGTCTGGTAA CTGCACAGTC TCATATGCAA TACTAATTAC TTTTCTATCT ATCAAAGCTT 9060 

GTGTTAATTT TTCTTCATTT GCTAAATGAa gatAaGTGAA TAATACAAGC CCTTCTTTAA 9120 

AATATGGATA TTCAGATTCA AGTGGTTCTT TAACTTTAAT AACCATATCC ACATCCCAAA 9180 

CTTTTGCTTG TTCAGCAACA ATCTCAGCAC CTGCTTCTTT GTAATCTACA TCTTCAAAGA 9240 

ATGATCCTGA ACCCGcATTT GTTTCCACTA AAACAGTATG 92 80 
(2) INFORMATION FOR SEQ ID NO: 132: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 466 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 132: 

CTGATTAATC TCTTGTTGTC GTGTATTTAC TAATTGAATC GTTGGTGTCT GAACACGTCC 6 0 

CAGGGATAGC TGTGCATCAT ACTTTGTTGT TAGTGCACG C GTTGCATTAA TCCCAACAAT 12 0 

CCAATCTGCC TCACTTCTCG CTAACGCTGC ATAATACAAA TCGTTATATT GACGACCGTC 180 
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ACGGATTGGC TTTTTGTTAC CAACTTTATC CAAAATCAAT CTTG CAACTA GTTCACCTTC 3 00 

TCGTCCaGCA TCTGTTGCAA TAATAATATC TTTCACTTTA TTATCTAAAA TTAACGCTTT 3 60 

5 TACTGTTTTA AATTGTTTGC TTGTTTTACC AATAACAACA GTTTTCATAT ATTTAGGTAT 420 

AATTGGAAGG TCTTCTAATC GCCATTCCTT TAAATTTTTA TCGTATTGTT CAGGTGTCGC 480 

ATTTGTCACT AGATGACCTA ACGCCCACGT GACAATATAT TGGTTATTTT CAAAGT AAC C 54 0 

'° ATTACGCTTC TGATTTATTT GTAAAG CATC AGCAATATCT CTTGCGACTG ATGGTTTTTC 600 

AG CTAATATT AAAGATTTCA TAAATTATCC TTTCT CATAC GTTCTTTTAT TTCGAACGTG 660 

CTTCATCTAT TCCACTAATC TTTGATTTAA ATTCAATGAT TGCAAATGAT GTGTTAAATG 720 

15 

TATTGTAACA TGTTAATATC ACTATTAACT TTCATTTCAG TTGAAATACT ATATAATAAA 780 

AGTAACAAAA AGTACGGAGG TAATGACATG AGCATAGTTC AGTTATATGA TATTACACAA 84 0 

^ ATAAAATCGT TCATTGAACA TTCGAATTAT GAATCAGCAT CATACTTATA TAAACTTCCT 90 0 

CAACAGTACA ATGAAATAGA TGTATTAATA ACCGATGCGA TTGAATCACC TGGTGTATTT 96 0 

TCGATTAAAG AAAACGATTC AATCAAAGCA ATCATATTGT CTTTTGCATA CGATAAAAAT 102 0 

2S AAATTCAAAG TCATAGGCCC TTTCGTGGCT GACAATTATG TATTATCTGT CGATACGTTT 1080 

GAAACGCTAT TTAAAGCAAT GACTTCGAAC CAACCTGACG ATGCCGTCTT TAACTTTTCT 114 0 

TTTGAAGAAG GCATTCAACA ATACAAACCA TTAATGAAAG TTATTCAAGC AAGTTATAAC 1200 

30 TTCACTGACT ATTACATAGA AGCCCGTACA AGATTAGAAG AAGATATGCA CCAACCAAAT 126 0 

ATCATTCCTT ATCACAAAGG GTTTTATCGT GCTTTCAGCA AATTACACAC AACTACATTT 1320 

AAATATCAGG CACAGTCACC ACAAGATATC ATTGATAGTT TAGACGACCA TCATCATTTG 13 80 

35 TTTTTATTTG TTAGCGAAGG TTTACTTAAA GGTTATTTAT ACCTTGAAAT TGATTCACAA 144 0 

CAGTCAATCG CCGAGATTAA ATACTTCAGT TCTCATGTAG ATTACCGTTT GAAAGGTATC 1500 

GCTTTCGAGT TGCTTGCGTA TGCATTGCAA TATGCTTTTG ATAATTTTGA TATTAGAAAA 1560 

40 

GTTTATTTTA AAATTCGTAA TAAAAATAAT AAACTCATCG AACGATTTAA TGGTCTAGGT 1620 

TTCCATATCA ACTATGAGTA CATTAAATTC AAATTC GAAT CACGTAACGT AAAAGATCAA 16 80 

^ ACAATCCCTG AATAAAACAC CAAGCAAATA CCCTACAGTA CATCATTAGC ATGTATTGTG 174 0 

GGTTTTTCTA CTTTTTGTAA ATATTGAAAA TTATAAGTAG TTGTTTTTTA CTATTAGGGC 1800 

AGAATGCTTT ACAATAACAT GCAAGTGTCA ATTAAGGGGA GCACTTGCAT AAATAGTATA 18 60 

SO GGAGAGTGAG TAGTCTTGCA ATTTCTTGAT TTCTTAATCG CACTTTTACC TGCTTTATTC 1920 

TGGGGAAGTG TCGTT CTTAT TAATGTGTTC GTCGGCGGTG GACCTTACAA C CAAATTCGT 1980 
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TTCAATAATC 


CTACTGTAAT 


TATTGTCGGT 


CTTATTTCTG 


GTGCATTATG 


GGCGTTTGGA 


2100 




CAAGCGAATC 


AGCTTAAATC 


TATTAGTTTA ATCGGTGTAT 


CAAATACTAT 


GCCAGTTTCT 


2160 


5 


ACAGGTATGC 


AATTAGTTGG 


TACAACATTA 


TTCAGCGTTA 


TCTTTTTAGG 


TGAATGG TCT 


2220 




TCAATGACTC 


AAATTATCTT 


TGGTTTAATC 


GCCATGATAT 


TATTAGTTAC 


TGGTGTAGCA 


2280 




CTTACTTCAC 


TTAAAGCTAA 


AAATGAACGT 


CAATCAGATA 


ATCCTGAATT 


TAAAAAAGCA 


2340 


ATGGGTATTT 


TAATTGTATC 


TACAGTTGGA 


TATGTAGGTT 


TCGTTGTACT 


TGGTGACATC 


2400 




TTTGGTGTTG 


GTGGAACTGA 


TGCATTGTTC 


TTCCAATCTG 


TCGGTATGGC 


AATTGGTGGC 


2460 


IS 


TTTATCCTAT 


CCATGAATCA 


TAAAACATCA 


CTTAAATCAA 


CAGCACTTAA 


TCTATTGcCA 


2520 




GGTGTGATTT 


GGGGAATTGG 


TAACTTGTTC 


ATGTTCTATT 


CTCAACCAAA 


AGTTGGTGTA 


2580 




GCTACAAGTT 


TCTCATTATC 


ACAGTTACTT 


GTTATCGTTT 


CAACCTTAGG 


CGGTATTTTC 


2640 


20 


ATTTTAGGAG 


AAAGAAAAGA 


TCGTCGTCAG 


ATGACGGGTA 


TTTGGGCAGG 


TATTATTATT 


2700 




ATCGTGATAG 


CTGCTATAAT 


TCTAGGTAAT 


TTGAAATAGA 


AAGTTAAATA 


CTCATGTAAC 


2760 




GTAAAAATGT 


AATCACTTCT 


GAAAATAACC 


ATTCACTTAT 


AGAATGATTA 


AAATTAATTT 


2820 


25 


TCGGGAATTT 


TACGTTGAAT 


GTTCCTCTAT 


ATGTCCTAGG 


AAATACGTGG 


CTCTAAAAAC 


2880 




AAAACGCAAT 


AACACATCAT 


GACATTAATC 


ATGCGTTTTA 


AGACTTTAAA 


ATTAGCGATA 


2940 




CTTTTAAAAT 


CTTGATGATA 


TTCATATATC 


AAGTATGCGC 


CATACATATG 


AAGTGGATAG 


3000 


30 


CTGCATAACG 


CACTGCATTA 


TCAACTTGAA 


TGTATGAGTT 


GAACAACTAT 


GTCATAAATA 


3060 




AAAGCCCCCT 


TTTCACAATA 


TACATTTACA 


TATTGTGGTA 


AAGGGGGCTC 


TCATTTTCTA 


3120 




CGAATACTAA 


AATGGATTTT 


ATTTTCAAAT 


GTGTAAACTA 


GACAAACACT 


GCCTGATACA 


3180 


CGTACAAAAT 


AATGATACTA 


ATAATGATTG TCAAATTGGT 


CGTCATACCT 


AT AAATGG CA 


3240 




GTGTTCGATA 


TTTAAACTGA 


ATACCATAAG 


AAATAATTGC 


AACACcTACC 


GGGAACATCC 


3300 


40 


AAGTGACCAA 


CAATGTCGTC 


TTAATCATAT 


CATCTGATAC 


TGGTAACAAC- 


ACATATACTA 


3360 




ACAATCCCGC 


AACTAATGCT 


AATCCATAAT 


GCAAACATAA 


ATATTTAATA 


GTAGCAGGTA 


3420 




TATACTTTCT 


TTCCAGAGTA 


AAATTCAACA TGACACCTAG 


CAAAATCATT 


GATAACGGCA 


3480 


45 


TATTTGCATG 


GGAAAGTATG 


CTAAAGAAAT 


CGATTGCCAC 


ATGTGGTAAA 


TGGATGTGAC 


3540 




TTATATTCAA 


TATAAACATT 


ACAATG TATG 


TAACGAGTGG 


CACTGATTGT 


AATAATTTCT 


3600 




TACCTAAATA 


TTTAAAATCG 


AATTGATCAC 


TACCTTCACT 


AAAGTAGCTA 


CCTACAAAGT 


3660 


50 


AAGTAATTCC 


AAACATCACA 


AAGGCACCAC 


CTATATCAGC 


CATAACAAAA 


TAAATAAGTC 


3720 




CCGTTTTAGG 


CCATATCACT 


TCAATTAGTG GATATGCAAA 


CAATCCAATA 


TTCATAGCAC 


3780 
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CAATCATTTT CGCCACAATA CCATATATAA TCATTAAAAT TGGTAAAATG GAGAATGACA 3 90 0 

ATTTTAATTC TGCACTGTTT AAATTCACAA TAACTAAAGA TGGGAGTGTG ACATTAAGAA 3 9 60 

CTAATGTAGC AATGACTTGA CTAT CTGTTG CTTTTATAAA ATTAATGCGC TTCAAAAAGT 4020 

AACCAAGCGC AATTAATAAA ATAATCATAG TAAATTGTTC TGTCACTGTT ATCCCTTCTT 4080 

TCAATAATCT TCATAATTTA TAACTTTAAC ATACTCCACA GATATTTTAG AAGTCTACTG 414 0 

TTTCATGCTA TAATCTACAT TAAATGCACT TAATTATATT TCAAAGGAGT GTTATAGTAT 42 00 

GTCTTTAGAA AACCAACTAG C CGAACTTAA ATATGATTAT GTTCGTCTTC AAGGTGACAT 4 2 60 

AGAAAAACGG GAATCTTTGA ATTTAGATAC TTCCGCACTT GTTCGTCAAC TTAAAGATAT 4 3 20 

TGAAAATGAA ATTAGAAACG TTCGTGCTCA AATGCAAGAT TAATAATCTA TCATTCAAGC 4 3 80 

AATAAATGCT TTTTGTTACA TAAATTTGAC TAGCATTGCT CTGAATACGT TATATTGATG 4 44 0 

AATTG CTTCA TTTTTCGCTC AATTACATCT AGAATCACAA GATGTTGTCG TGTTATGATT 4 500 

TAGTGTTTCA TTAACAACAT ACACGCATAT CTATCCCAAC ACTGCTATTT ATGTTTTCTA 4 56 0 

CGCTGnTGTA CTACATGAAC CCTTTGAAAC GGAGAGGAAG TTATCATATG CAATTTTAnC 4 620 

TGATTTTACT AG CAATACTT TAACnAATTG nTAGTTTAAT AGAATTTTA 4 66 9 
(2) INFORMATION FOR SEQ ID NO: 133: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2785 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 133: 

TTTGCACCCA TCTGaTACAA TGCACCATGC GGTTTAACAT GATTAATTTT AACTTGATGA 6 0 

ATGCGACAAA ACCCTTGTAA TGCACCTAAT TGATAAATCA TCAAATTATA AATCTCGTCG 12 0 

TTAGAGATAT CTATATTTCG TCTGCCAAAG CCTTTCAAAT CAGGTAAACC AGGATGTGCA 180 

CCTACTGCAA CATTATGTGC TTTGGCAAGT TTTACCGTTT CATTCATTAC ATTTTCATCA 24 0 

CCAGCGTGAA AACCACAAGC AACATTCGCA CTTGTAATTA ACGGAATAAT TTGATGATCA 3 00 

CCACCAAAGG AATAATTTCC AAATGCTTCG CCTAAATCAC AATTCAAATC AACTCGCATT 360 

ATAATTCCAC CCCTTTAACA ATTTGATGTT TTTCTAAAAA TTTAATATCA ACATCTTTTG 4 20 

CATCTCCATC ACGATATAGT GGATAATTTA AAACTGCATA TAAAAAATCG GCAGTTGTAG 4 80 

AAAATCCATC TATCACCATT TCATCTAAGG TGACTTTCAA CTTATCAATT GCTGAAGCTC 54 0 
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AACCGTGATA TAGTAAAGAA TCGACTCGCA CATTAAAGCC TTGAGGTAAA TGTAACGCTG 660 

TCACTTTACC TGGTGTTGGT TGAAATTTCT TTTCaGGATT TTCGGCATTT ATTCTCGCTT 72 0 

CTATCACATG ACCATTAAAT TGAATATCGC TTTGTGAAAA AGGTAAATGA TTATGTTCCA 780 

ATAAATACAG TTGTGCTGCA ACCAAATCAC GTTCTGCTCG CATCT CTGTA ACAGTATGTT 84 0 

CAACTTGTAT TCGAGCATTC ATTTCAATAA AGTAATGTGC GGTATCAGTT ACTAAAAATT 900 

CAATCGTACC TGCACTTCTA TAATTTGCTG CACGTGCAAC TTTAACAGCA TCGTTACATA 960 

TTTGTTGTCG TCTTTCTTCA GTTAATGCTG CACAAGGAGA TTCTTCGATT AATTTTTGAT 1020 

TTTTACGTTG TACAGAACAA TCACGTTCCC CTAAATGTAC ATAATTATCC TGCCCATCTC 10 80 

CCaTAACTTG AACTTCAACA TGTTTTGcAA CAGGTATAAA AGCCTCAACA TAAACACGAT 114 0 

CATCATCAAA GTATTTTTTT CCTTCACTTT TAGCTTCTTT AAATGCCTTT TCTAAATCTT 12 00 

CAGCTTTCTT TACAATACGT ATACCTTTAC CACCACCGCC ACTGGCAGCT TTGATAACAA 1260 

CTGGATAACC GATGTCTTTG GCAAGATTCT CAATTTCAGA CACATGATTC ACAGCACCAT 1320 

TTGATCCTGG AATCACAGGA ACACCTGCAT GATGAACTGT TTGTCTTGCT GTTATTTTAT 13 8 0 

CCCCCATCAT TTCCATCGTT TTTTTAGTAG GCCCTATAAA CGCTATGCCT TGTTCCTCAA 144 0 

CGGTTTGAGC AAATTTTGTT GATTCTGATA AAAAGCCATA TCCTGGGTGA ATTGCATTAG 1500 

CACCAGTGAT TTGTGCAGCA GATATGATGC GGTCAATATT TAAATAACTA TCTAAAg CAT 156 0 

TArcwTCCCC AATACATATA GCTTGATCTG CTAAATGTAC ATGCAAGCTT TGCTCGTCCC 1620 

CTTTTGCATA AACTGCTACA GTTTCAATCC CATATTCTCT GCAAGCTCTT ATAATCCTTA 16 8 0 

CAGCAATTTC ACC TCTGTTC GCAATTAAAC AACGAAGCAT TTACTTACCC CCTTTACTTA 174 0 

ATACGTACCA AAACTTGGTC GT ATT CAACA TTTGTGCCAT GATCAGCTAC TATTTCAGTA 1800 

ATTfiTTCCAG CAACATCTGT TGTTACCTCG TTTAATACTT TCATCGCTTC AACATAT CCT 186 0 

ATAATATCTC CCTTGTTAAC TTTGTCACCG ACATTCACAA TTGGTTCAGT TAATTCTTTA 192 0 

CTATCTTGTA AAAAGAATGT ACCTATCATT GGTGATTTAA TGTCATGATA ATCATTTGTC 198 0 

GAAACATCGG AGTTATCATT CGCTTTTGAA GCTGTCAAAT CATTATTGTT CATACTTTGA 204 0 

TTTGATTGAT TACTGTGTGC AGCCAAATGA TTCGAGTCAG TGAAGTCAAT TTCTATTTCA 2100 

TCTTCAAAAT TTTTATATTT AAATTTCTTA ACATCATTTT CCTTCACTAA TTTGATTATT 2160 

TGTTCGATTT nTTCAATATT CATTTTACAA ATCCCCTTTT AAAATTGTTG CTAATTTTTT 222 0 

CGAAGTATGT CGCAAGCTAG ATGTATCAAA AATTGGAGTC TTTTGATGAC TCTTAAGAAT 2280 

TTCATTAAAC AGAGACATTT GTTCCCGATT CTTATCTACA GCTTCTTGGA ATGATATCCA 234 0 
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TACAGTTGCA ATTTTGGTAT AACCACCTAT CGTTTGTTTA TCATTAAGCA GAATAATAGG 24 60 

TTGACCATCA TTTGGTACCT GAACACTACC AAGAGCAACC GGTTCAGAAA TGATATCTGC 252 0 

5 TTGATTAAtT GGTGCAACGC TGTCACCTTC CAAA CGATAG CCCATACGGT CTGATTGTTC 2 5 80 

AGTAATTAAA TATGGATGAT TTACAATTTT CGCTCTAGCC TCTTCAGAAA ATGCCTCGAA 264 0 

TTGAGGTCCT TGAAGAATGT GTATAATATT ATTTTCTGGC AATAAATCGT CCTGTAAATG 2 700 

w 

AATCGTCTTT CCAATGTTTT CTTTAAAGTC ATTATTTATT TTCACTGTTA TTACATCATC 2 76 0 

AGCTAATAAC TTTCTACCTT TGAAT 2 785 

(2) INFORMATION FOR SEQ ID NO: 134: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1010 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 134: 



25 


AATGGAAACG 


GTTGAAACAG 


CAATTATTAC 


TATTTCTATG 


GGTGAAGGTA 


TTTCAGAGAT 


60 




ATTTAAATCA 


ATGGGTGCCA 


CACATATCAT 


TAGTGGTGGA 


CAAACGATGA 


ATCCTTCTAC 


120 




AGAAGATATC 


GTTAAAGTCA 


TTGAACAATC 


AAAATGTAAA 


CGTGCAATTA 


TTTTACCGAA 


180 


30 


TAATAAAAAT 


ATCTTAATGG 


CAAGTGAACA 


AGCAGCGAGT 


ATTGTTGATG 


CAGAAGCTGT 


240 




TGTTATTCCA 


ACGAAATCTA 


TTCCTCAAGG 


TATAAGCGCA 


CTATTC CAAT 


ATGATGTGGA 


300 




CGCAACACTT 


GAAGaAAATA 


AAGCGCAAAT 


GGCTGATTCA 


GTAAATAACG 


TTAAATCTGG 


360 


35 


TTCATTAACG 


TACGCTGTTC 


GTGATACGAA 


AATTGATGGC 


GTTGAGATTA 


AAAAAGACGC 


420 




GTTTATGGGC 


TTGATTGAAG 


ATAAGATTGT 


AAGCAGCCAA 


AGTGATCAAT 


TAACAACGGT 


480 


40 


TACTGAGTTG 


TTAAATGAGA 


TGTTAGCAGA AGATAGTGAA ATATTGACTG 


TGATTATTGG 


54 0 




TCAAGATGCA 


GAGCAAGCAG 


TTACAGATAA 


CATGATAAAC 


TGGATCGAAG 


AGCAATATCC 


600 




AGATGTAGAA GTGGAAGTTC 


ATGAAGGTGG 


ACAACCAATT 


TATCAATATT 


TCTTTTCAGT 


660 


45 


AGAATAAAAA 


TTTAAAATAA 


AAAACTACCA ATGATAAATC 


ATCAGTTGGT 


AGTTTTTTAT 


720 




TTTGCTATTT 


TAGTGATATT 


GCGGGTTAAA 


AGTATCGTTC 


TCGAGTTGCT 


AACAATGTCA 


780 




TGTTCAACTT 


AGTCATGATA 


AAATAAATAA 


CATACTAAAT 


GATACGTAAA 


ATCAAATAAA 


840 


50 


ACATAGGTGA 


TTTATTTTGG 


CTAAAGTAAA 


CTTAATAGAA AGTCCATATT 


CTCTTTTACA 


900 




ATTAAAAGGT ATAGGTCCTA 


AGAAAATAGA AGTATTGCAA 


CAACTAAATA TTCATACAGT 


960 
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(2) INFORMATION FOR SEQ ID NO: 135: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 154 0 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



to 


(xi) SEQUENCE DESCRIPTION: 


SEQ ID NO: 135: 








TGTAGTTGAA CATGAACAAC 


AAAAGAAAGA 


AAAGACAAAA AAGCAATACA 


AG CCATTTTG 


60 


15 


GATTGTCATG AGTTTTATAA 


TACTTATAGT 


TGTACTATTA CTCCCGGCAC 


CTTCAAGTCT 


120 




GCCGATAATG GCTAAGGCAG 


TACTAGCTAT 


TTwAGCTTTT GCAGTTATTA 


TGTGGGTAAC 


180 




GGAAGCTGTA TCATATCCGG 


TGTCAGCAAC 


TTTAATTATT GGCTTAATGA 


TATTACTTTT 


240 


20 


AGGATTTAGC CCTGTTCAAA ATTTAGGGGA 


GAAGCTAGGT AAT CCGAAAA 


GTGGCAGTGC 


300 




TATTTTAGCT GGAAGTGACC 


TTCTAGGAAC 


TAATCATGCA TTATCATTAG 


CGTTTAGTGG 


360 




ATTTGCAACT TCAGCTGTAG 


CTCTCGTTGC 


AGCTGCATTA TTTTTGGCTG 


CTGCTATGCA 


420 


25 


AGAAACGAAT TTGCATAAAA 


GACTAGCTCT 


TTTAGTGTTA TCAATTGTTG 


GTAATAAAAC 


480 




TAGAAATATA GTTATTGGAG 


CAATTATC GT 


TTCAATTGTA CTTGCATTTT 


TCGTTCCTTC 


540 




TGCAACAGCT AGAGCAGGGG 


CAGTTGTACC 


AATCTTGCTG GGTATGATTG 


CGG CATTTAA 


600 


30 


AGTTTCCAAA GATAGCAAGT 


TAGCGTCTTT 


ATTAATAATT ACTTCAGTAC 


AAG CTGTGTC 


660 




AATTTGGAAT ATTGGTATCA 


AAACGGCGGC 


AGCACAAAAT ATCGTAG CGA 


TTAATTTTAT 


720 




AAACCATCAA TTAGGATTTG 


ATGTTTCATG 


GGG CGAGTGG TTCTTATATG 


CAGCGCCTTG 


780 


35 


GTCCATAGTT ATGTCCGTAG 


CTTTATATTT 


CATCATGATT AAAGTGATGC 


CTCCAGAAAT 


840 




TAATS.CAATA GAAGGTGGTA 


AAGATTTAAT 


AAAAGAAGAA TTGCATAAAC 


TTGGCCCCGT 


900 


40 


TAGCCCACGT GAATGGCGTT 


TAATTGTTAT 


ATCGATGTTA TTATTACTGT 


TTTGGTCAAC 


960 


TGAAAAAGTA TTACATCCGA 


TTGACTCTGC 


ATCCATTACT ATTATTG CTT 


TAGGTGTTAT 


1020 




GTTAATGCCG AAAATTGGTG 


TCATGACATG 


GAAACATGTT GAAAATAAAA 


TAC CATGGGG 


1080 


45 


AACAATTATC GTGTTTGGTG TAGGTATTTC ACTAGGTAAC GTTCTTTTGA AAACAGGTGC 


1140 




AGCTCAATGG TTAAGTGATC 


AAACTTTTGG 


TGTTTTAGGT TTAAAACATT 


TACCTATTAT 


1200 




CGCGACAATT GCACTTATCA 


CGCTTTTTAA 


TATATTGATT CATTTGGGCT 


TTGCGAGTGC 


1260 


50 


AACAAGTTTA TCATCAGCGT 


TAATACCTGT 


TTTTATTT CG CTAACCTCTA 


CGTTACACTT 


1320 




AGGAGACCAG TCTATAGGAT 


TTGTTTTAAT 


TCAACAATTT GTTATTAGTT 


TTGGTTTCTT 


1380 
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AGATTTCTTG AAGGCAGGTA TACCATTGAC AATTGTAGGG aATAtCtAgT GaTAGTTTTT 1500 

AGCATGACTT ATTGGAAATG GGTAAGGTTG CnTTAATTAA 1540 

(2) INFORMATION FOR SEQ ID NO: 136: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11823 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 136: 

ACTTCTCACA ATAAGAAATA TGAAATTGTT ATGTGTTAGT TGAGATTCAG TGATGAATTA 6 0 

CTTTTATCAT TTAAAATGTT GTTATCATTG TCATGCGTTA CCAAATCGCT TACGTATACA 120 

CGATTCCCAA TCTTAACATA GACGATTTGT ATATCAGAAT TTTCTGATTA CTAACAGTTT 180 

ACCTAAGTTT AAATATCTGT TCAATGATTT TCAGTTATTT TTAAAAGAAA AATCGTAATG 24 0 

CTGCCATGAT AACAATCCCA CTAATAATTG TAATAGTTAA AtACGCGTGA TTATAGATAA 3 00 

AATAACCGTC GGAATGAGCG CGATAATGTA AGGGATGTTT AATGTATACC CCTCACCATG 3 60 

AGGCGTCTGT TGAATAATGC TGTCAATGAC AAGTGCCGTA AATAGTGTGA TTGGGATAAA 420 

TGATAGCCAT CGAACCACGA CATCAGGCAA TTGCACTTTT GAAATCATGA TAAAAGGTAT 4 80 

AATTCGAATT AATAGCGTTA CGATACCACA CAATAAAATA AGTATTAACA TGTTCATATG 54 0 

AGTTATCATT GTTCCATCAT CACTCCTAAC GCTGCTGAAA TTGTGGCTGC AATTAATATT 600 

GCTAGATATG AAGGCATAAA CATACTTAGC GATAACATCA TTACTATGAC GGCAATAATG 660 

AGTACTATGT AAATTCTTAA TCGCGATTTA GTAATTGATT CAAATTGCGC AATGGCCAAA 72 0 

AAGATAAACA TAGCCGTGAT AGCAAAATCT AAC CCTAGCG TTTGCGGATT TGAGATATAT 780 

TCGCCAAATA AAGCCCCAGC TACACATGAA ATTGCCCAAA ATAAATATGC TGTGATGTTA 84 0 

AGACCATGCA TCCAACGATC ATTGATAGCT TCTC CTTTTA AATAAGGTGT AATGGCGACG 900 

CCAAACGTTT CGT CAGTT AC TAATGAACCT AATCCAACAC GGTTCCAAAA CCCATATGTC 96 0 

TTGAAGTTTG GTG CAAGCGA CATACTTAAA AGGAACATTC TTGAATTTAC GATAAATACA 1020 

GTTAGTACAA TCGCTGATAT AGGTGTACCT GCTATAAACA ACGCGCACAT AATAAATTGC 1080 

GCAgcaCCGG CATATATAAC AAGACATAAC AAGACAATTT CTAAAATACT AAAGTTTTGA 114 0 

GACGAAGCCA CAATACCAAA TGAAATACCA ACACCGGCAT AACCCAATAA TGTTGGGATA 12 00 

CACTCTTGCA CGCCTTGTCT AAAACTTAAA TGTGTTGTCA TCTCAATTAC CTCCTTTGCC 1260 
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TAAGCAATAA 


CATTAGACAT 


CAGTTTGTCT GAGGTTAGAC 


ATTCCGGAGT 


CTTTAGTCAG 


1380 




CTTCATATTA 


ACTTTTTATT 


TTTGAGAATT TTCAATTTTT 


TATTTAAG A C 


TACCTCCATA 


1440 


5 


TTTTCTATGG 


aTTTGTAGTT 


GTTTTTAAGT ATCAATTTTA 


TAAATTTTTA 


TATCTGATGA 


1500 




TGAGTCTGGG 


aTATTGaTTC 


ATGTACCACT CCCTTaTaAT 


CATCCCCTCC 


CCCTaCCCTA 


1560 




CTCCATCGAT 


ATAACTCATA 


CTACATATCA ACGAAATCAG 


TATTTTAT CG 


CTTCCTTTCC 


1620 




TATATTAGTG 


ATGCTCAAAC 


TTGTTACGTT TTAGATTGTT 


TTAGTTCATC 


ATAATTATCC 


1680 




CGTATTGTTG 


CTATAATGAA 


ATGCGTTCAC CCCATTAAAC 


CACAAACTTA 


ATTTATTGTT 


1740 




GTTATGTGCA 


TTGGCTCACT 


ATTATATTTT TACAGCACAA 


AAAAAGTGGC 


GACAGTTCGT 


1800 


15 


CACCACTTTT 


TAAAATATTA 


TTTAAAGTAT CTTGCCCTTG 


CTTTAAGTAT 


ACGTAGATAT 


1860 




AT AC TTTTT A 


AAGCTTGTAG 


CTAAAGCCTT TATTTAACTG 


GTTTTGAAAT 


TTGTGTTTTA 


1920 


20 


CCACCCATAA ATGGTACTAA 


TGCTTCTGGA ATTGTTACTG 


TTCCATCTTC 


ATTTTGGTAA 


1980 




ttttcaacaa 


TAGCAGCAAA TGTACGTCCA ACTGCTAAAC 


CACTACCATT 


TAATGTATGT 


2040 




GCTAATTCTG 


GTTTAGCTGC 


TTTGTCACGC TTGAAGCGGA 


TGTTAGCACG 


ACGCGCTTGG 


2100 


25 


AAATCCGTAC 


AGTTTGAGCA 


TGAACTAATT TCTTTATAAT 


CATTGTAGCT 


TGGTAACCAA 


2160 




ACTTCTAAAT 


CATATGTTTT 


GCTTGCACTA AATCCAATAT 


CACCTGTACA 


TAAAATAACA 


2220 




CGACGGTATG 


GTAAAC CTAA 


CTCTTCTAGA ATTGCTTCTG 


CGTTTG TTG T 


CATTTCTTCT 


2280 


30 


AAAGCATTCC 


ATGAAT CTTC 


AGGTTGTTCA AAACGTACCA 


TTTCCACTTT 


AT CGAATTG A 


2340 




TGTAAACGAA 


TTAATCCTCT 


TGTATCTCTA CCTGCTGATC 


CTGCTTCACT 


ACGGAAACAT 


2400 




GCAGATTGAC 


CAGTGAATTT 


TTCAGGAAGT ACACCTGGTT 


GAATAATTTC 


ATTACGGTAG 


2460 




AAATTCGTTA 


ATGGTACTTC 


AGCAGTTGGA ATTGTATATA 


AT CCTTCTTT 


TTCTACTTTA 


2520 




AATAAATCTT CTTCAAATTT AGGTAATTGA CCTGTACCAT ACATTGTATC TGCGTTCACA 


2580 




AGCTGTGGTA 


CCATCATTTC 


TGTATAACCA TGTTGTGTTG 


TATGTTTTGT 


AATCATATAG 


2640 


40 


TTCATTAAAG 


CACGCTCTAA 


TTGCGCACCT TCATTTGTTA AATATACAAA ACGCGCACCT 


2700 




GAAACTTTTG 


CTGCACGATC 


AAAATCAGCC ATTTTCAATT 


CTTCTACAAT 


ATCCCAATGT 


2760 


45 


GCTTTGGGTT 


CAAATGAAAA 


CTCaCGTGGT GTACCCCACT 


TTTTAACTTC 


AACGTTATCT 


2820 




TCATCAGATT 


CACCTTGAGG 


TACATCATCA CTTATTAAAT 


TTGGAATACG 


ACAAAGGATA 


2880 




CCTGTCATTT 


TATTATCAAT 


TTCATTTAAT TGACTATCTT 


TTTCTTTAAT 


ATCGTCACCT 


2940 


50 


AATGTGCGCA 


TTTCAGCAAT 


CACATCATCA GCATTTTCTT 


TATTACGTTT 


TTTTAATG CG 


3000 




ATTTCTTCGC 


TTACTTTATT 


ACGACGTGCT TTCATTT CTT 


CTGTTGCACT 


AATTAATTTA 


3060 
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TCAATTTTGC TCTTAACTGT GTCAGGCTCA TTTCTGAATA ATCTAATGTC TAACATTAAC 3180 

CTTCATCCTT TCCCAAATAA TTATCATTTA TTATGGAATG ACGTACGTCT TTATTTTTTA 324 0 

GAAAATAAAA AAAGACCACA TCCCTACAAG GGACGTGGTC TACGCGTTGC CACCCTATTT 33 0 0 

AACAATTTAA GTTATAAAGA TACACTAAAC CTAAATTGCA CTTCACTAAA ATAACGGTTA 33 6 0 

TCACCGATTG TTCTTTTAAA TTAAGTAGGT AGATTCATAT ATATGTT GAT TCTTGTTCAC 34 2 0 

ACTAACCACA AGCTCTCTGA TATCGAACAC TATATATTAC TTGTCCTACG AACAATGTCT 34 8 0 

TATTAAGTTA TTTTTAATAT AG CAAACTAT ATTTGCTTTT TCAAGTAACG ATTTCAAACA 354 0 

TCACTCATGT CGATTTAGTG ACATGCAGTC GTTTGATAAA TTGATTGCTT TAAATACTGT 36 00 

GCAACCGCTT CAATATCTTT ATGAAATTGA CGATCATGTG TAATGGATGG CACGATACTT 3660 

CGAAACTCAT CATACTTGCG ACGTGTTTTT GGTGATAATC CTTCAACACC TTTTAACTCT 3720 

GCTG CTTGTA ATGCAATAAC ACATTCGATT GCCAGCACAC GTCTTGCATT TTCAATAATT 37 8 0 

TGATAACCAT GTCTAGCAGC TGTAGTTCCC ATAGATACGT GATCTTCTTG GTTCGCAGAT 3 84 0 

GAAGTGATAG AATCAACACT CGCTGGATGC GCTAAAGTTT TATTTTCAGA AACGAGACTT 3 90 0 

GCAG.CAGCAT ATTGCATAAT CATCGCGCCA CTTTGCAATC CTGGCTCTGG ACTAAGAAAT 3 960 

GCTGGTAAAT CACCATTTAA TTGAGGATTT ACTAGTCGCT CTAGACGACG TTCCGATACG 4 02 0 

TTTGCTAATT CACTTACACC TAATTTAAGA TGATCTAATG CAAAAGCAAT AGGTTGTCCA 40B0 

TGGAAGTTAC CACCTGAAAT AACAAACGTT TCATTTGCTT CCTCAAATAT AAGTGGATTA 414 0 

TCATTAGCCG CATTCATTTC AAATTCTAAT TGCTGTTTAA CATAATTGAA TACTTGAAAA 4200 

CTCGCGCCAT GGATTTGTGG TATACAACGC AACGTATATG CATCTTGTAC ACGTATTTCT 4260 

GATTGTCGCG TCGTTAATGT TGATCCTTCT AACCAATCAC GCATACGCGC TGCCACATTA 4320 

ATCTSTTCTT GAAAATTACG AACTGCGTGC ACATCATGTC GATATGCATC TATAATGCCA 43 80 

TTAAGAGACT GATGCGTTAA TGCAGCAATC CATTCAGATT GGTAACCTAA ATCTTCTGCT 4440 

TCTATATAAC TAATGACACC TTGAGCTGTC ATAGCTTGCG TACCATTAAT CAATGCTAAA 4 500 

CCTT CTTTAG CCTGAAGGTT CAAAGGTTGT CTATTTAATT CTCTTAATAC ATCGTCACTA 4560 

TCCTT T TCTT CCCCTCTGTA CAATACTTTC CCTTCACCAA TTAATG CTAA TGCTAAATGT 4 620 

GATAATGGCG CTAAATCTCC TGATGCACCG AGAGAGCCTT GCTGTGGGAT TAT CGGTATA 4 680 

ATACGTTCAT TTATAAAAAA TTGTAATTGT CTCACTAATT CTAAAGTGGC ACCTGAATGA 4 740 

CCTTTTAATA ATGTATTCAA TCGTAAAATC ATCATGACTA ATGCTACTTC TTTTGAAAAT 4 800 

GGCTCACCTA GTCCACAGGC ATGTGAGCGT ATCAGATTCA CTTGTAATTC ATTATATTGC 4 860 
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TCCTCATTTT CAATAATACG TTCAACTACC GCTCTACTTT TTTTGACACG TTCTAACGCA 4 9 80 

TCATCAATAA TTTCAATCTT TGATTGTTGT TGTAAAAATG ATTTAATATC CTCAATTGTT 5 04 0 

5 AGTGTTTCAC CATCTAAATA TAAAGTCATA TATGTTACCC CCTTGTTTAT ATTAAGTAAC 5100 

CCATCCTTCT TGAAGTATAC GTTTTCATTT TTATTGAAAC AATGGTTTTA CGTACATTTA 5160 

TAACCTATTA TCAGAGCACT ATTGTAGTGC GTTAAAGGAT ATTAAGATTG TTGTAAG CAT 5220 

w 

ATTTAATAAT TTATCTATTG ACGAATTGCA TATACAGGTA TAGTATTTTC TATTGTATTT 52 80 

AACGACAAAT AATAATGAAT TCAGAAATTT ATAATACATT TTGTTAAAAG TTACTATATA 534 0 

TTTTTAAAAT TGAATAAATT CGGAAAAGGC TTTTACATGG GAGGTTATAT CACTATGGAA 54 0 0 

IS 

ACGTTAAATT CTATTAACAT TCCTAAGCGT AAAGAAGATT CACATAAAGG TGATTATGGC 54 6 0 

AAAATTTTAT TAATTGGTGG ATCTGCTAAC TTAGGTGGTG CCATTATGTT AGCGGCTCGT 5520 

2o GCATGTGTAT TTAGCGGTAG TGGTTTAATC ACTGTAGCTA CACATCCAAC AAATCATTCA 558 0 

GCATTACATT CTCGTTGCCC AGAAGCGATG GTTATTGATA TTAATGATAC GAAAATGTTG 564 0 

ACGAAAATGA TTGAAATGAC TGACAGTATA CTAATTGGTC CAGGTCTTGG CGTTGATTTC 5700 

25 AAAGGAAATA ATGCCATTAC ATTCCTACTA CAAAATATAC AACCGCATCA AAATTTAATC 5760 

GTAGACGGCG ATGCGATTAC AATCTTTAGT AAACTGAAAC CGCAATTACC TACATGTCGT 5820 

GTGATCTTTA CACCACACCT CAAAGAATGG GAACGATTAA GTGGTATTCC TATTGAGGAA 5 880 

30 CAGACATATG AGCGTAATCG TGAAGCAGTT GATCGTTTAG GTGCAACTGT TGTACTTAAA 594 0 

AAACATGGTA CTGAAATTTT CTTTAAAGAT GAAGACTTTA AATTGACAAT CGGTAGCCCA 6 000 

GCAATGGCGA CTGGTGGTAT GGGCGATACA CTTGCTGGTA TGATTACAAG CTTTGTCGGT 6060 

35 CAATTTGATA ACTTAAAAGA AGCGGTTATG AGTGCCACAT ATACACATAG TTTTATTGGC 612 0 

GAAAACCTTG CAAAAGATAT GTATGTGGTG CCACCATCAA GACTTATCAA TGAAATACCT 6180 

TACGCAATGA AACAATTAGA AAGTTAGTCA TTACTAATCA TTGAATATAG TAAAGCATTA 624 0 

40 CTTTCTAGCA TAAAAATAAG ACTCCCCTAC ATATAGGGAA GTCTTATTTT TTATTATTCT 63 00 

TCATCTGATG ATTGTTGTAT ATCTTCTTCA ACACGATCCA TGAAATCTTG TCTTACTTCA 63 6 0 

ATACGTCCAT CTTCATCATT TTCTTCTGAA TCAATCACTT CAGTATGAAT TGCATTTCCT 64 20 

45 

GGTGTTTCAT CATTTaCAAC CGCTTCACGT TGTTGTTCAG TACCATCTTC AGATACAGTT 64 80 

GAAGTAGATT GCTCATCTTC ATTCGTTTCA TCTTCTGCAT CTTCTTTTAC TTTAGCAACC 654 0 

^ GTTGAAACAA ATTGATCATC ACCTAAG CGA ATTAAGCGAA CACCTTGTGC TGCACGACCA 6600 

TTTTGAGAAA TATCTGCAAC ATCTAGTCGA ATAATGACAC CTGCATTAGT AACAATCATT 6660 
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GTAGCTGTTT TAATACCTTT ACCACCACGA TTTGATAAGC GATAGTCATT AACTGGCGTA 67 8 0 

CGTTTACCAT AACCATTTTC AGTAACTACT AATACTTCAT CAACACTGTT TGCATGAGCT 6 84 0 

ACATCAAGCC CTACAACTTC GTCACCTTCA CGAAGTGTAA TACCTTTCAC ACCCGTTGCT 6 90 0 

GTACGGCCTA AAGGACGTAA TGTTGATTCA GGGAATCGAA TTAATGATGC ATGTGATGTA 6 96 0 

CCAATCAAGA TATCTTCTTG ACCACTTGTT AAGCGAACTG CAATTAACTC ATCATCTTCT 7 02 0 

CTGAACGAAA TCGCAATCTT ACCATTTCTA TTTATTCTTG AGAAGTTACT TAATG CTGAA 7 080 

CGTTTAA CGA CACCACGTTT AGTTGCAAAC ACTAAGAAGT TGTCTTCACT TTCAAGGTCT 714 0 

TTAACAGCAA TCATTGTACT AATGACTTCA TCATTTTCAA GTTCAATAGC ATTCACTACA 7200 

GGAATACCTT TAGACTGTCT TGATAACTCA GGCACTTCGT AACCTTTAAG TTTGTATACA 72 6 0 

CGACCTTTGT TAGTAAAGAA CAATACATGG TCATGTGTAC TTAAAGTTAC CAATTGACTG 73 20 

ACAAAATCTT CTTCCAATGT ATTCATACCT TGAACACCAC GACCACCACG GTTTTGAGCA 73 80 

CGATATGTAG ATACCGGCAA ACGTTTAATG TAGTTATTAT GGCTTAGTGT AATTACTATT 744 0 

TGTTCTTCTG GAATTAAGTC TTCGTCCTCT AAGTCTTCAA ATCCACCTAA TTGAATTTCT 7 50 0 

GTACGACGAT CATCACCGAA ACGATCTCTA ATTTCAGTCA ATTCATCTCT AACTAACTGT 7560 

AATAACACTT CTTCATCAGC TAAGATTGCT TCTAATTCAC TAATATAATT TAATAACTCA 762 0 

TTATATTCAG CTTCAATTTT GTCTCTCTCT AAACCTGTTA GACGTCTTAA ACGCATGTCT 76 8 0 

AAAATAGCTT GAGCTTGTTT TTCAGAAAGT TTGAAG CGTT GTTGCAAGCT TTCCATTGCA 774 0 

ACTTTATCTG TATCTGACTC ACGAATCGTT GAAATAATTT CATCGATATG GTCAAGTGCG 78 0 0 

ATACGTAATC CTTCTAAAAT GTGGGCACGA TCTTTAGCTT TACGTAAgTT GTATTGCGTA 7 860 

CGTCTTCTAA CAACTGTCTT TTGATGCTCT AAATAATGTA CCAACGCTTC TTTTAAATTA 7 92 0 

ATAAGCTTCG GTCTACCATT TACAAGTGCA ATCATATTCA CACCAAATGA TGTTTGAAGA 798 0 

GGTGTTTGTT TGTATAAGTT ATTTAAAATG ACACTAGCAT TTGCATCCTT ACGCACATCA 804 0 

ATAACGACAC GCACACCAGT ACGTAAACTT GTTTCA.TCAC GTAAATCAGT GATACCGTCA 810 0 

ATTTTCTTGT CACGAACGAG CTCTGCAATT TTTTCAATCA TACGAGCCTT ATTCACTTGG 8160 

AAAGGAATTT CAGTGACAAC AATACGTTGA CGTCCGCCTC CACGTTCTTC AATAACTGCA 8220 

CGAGAACGCA TTTGAATTGA ACCACGACCT GTTTCATATG CACGTCTAAT ACCACTCTTA 8280 

CCTAAAATAA GTCCAGCAGT TGGGAAATCA GGACCTTCAA TATCCTCCAT TAACTCAGCA 834 0 

ATTGAAATAT CAGGGTTCTT ACTTAAGCTA AGTACACCAT TGATTAATTC TGTTAAGTTA 84 00 

TGTGGTGGAA TATTCGTTGC CATACCTACC GCGATACCTG ATGCACCATT GGCTAATAAG 8460 
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AAATCTATTG TATCTTTATT AATATCACGT AACAGTTCAA GTGTGATTTT AGTCATACGC 858 0 

GCTTCAGTAT AACGCATTGC TGCTGCGCCA TCTCCATCCA TTGAACCAAA GTTACCTTGG 864 0 

CCATCAACAA GCGGATAACG ATAACTGAAA TCTTGAG CCA TACGTACCAT TGCTTCATAA 87 0 0 

ATAGATGAGT CACCATGAGG GTGATATTTA CCCATTACGT CACCAACGAT ACGTGCTGAT 8 76 0 

TTTTTATATG ATTTATCCGG TGTCATACCT TGTTCATTTA AT CCATAT AG TATACGACGA 8 82 0 

TGTACTGGTT TTAAACCGTC ACGAACATCT GGCAATGCAC GAGCAACGAT AACACTCATC 88 8 0 

GCATAATCTA AAAATGATTC ACGCATTTCA CTGGTAATAT TTCGTTCATT TATTCTTGAT 8 94 0 

TGAGGTAATT CAGCCATCAA GAGTTCCTCC TTCAAAAGTT CAGTT CACAG CG CTTAG AAG 900 0 

TCTAAGTTTG CATAAACTGC ATTATCTTCT ATAAATTGTC TACGGTTTTC TACAACGTCA 90 6 0 

CCCATTAACA TTTCAAATGT TTGGTCCGCT TCAATCGCAT CTTCAAGTTT TACTTGTAAA 9120 

AGAGCGCGGT GCTCAGGGTT CATTGTTGTT TCCCAtAATT GATCTGCATT CATTTCTCCA 918 0 

AGAC CTTTGT ATCGTGCAAT AGACCATTTT GGTGTTGGAT TCAATTCAGA TTTAAGTTTA 924 0 

TCAAGTTCCC TATCATTGTA TACATAATAC TTTTGTTTAC CTTGTGTCAG TTTATACAAC 9300 

GGTGGCTGTG CAATATACAC ATAGCCTGCT TCAATTAACG GTCTCATAAA TCGATAGAAG 9360 

AATGTTAATA ACAATGTTCT AATATGCGCT CCATCCACAT CGGCATCAGT CATAATGACG 94 20 

ATTTTGTGAT ATCTTGCTTT CGCTAGATCA AAGTCGCCAC CGATTCCTGT ACCAAATGCT 94 80 

GTGATCATTT GACGAATTTC ATTGTTATTC AAAATTCTAT CTAATCGTGC TTTTTCAACA 954 0 

TTTAATATCT TACCT CGTAA TGGTAAAATC GCCTG CGTTC TAGAGTCACG ACCAGATTTT 96 00 

GTAGACCCCC CGGCAGAGTC CCCTTCGACT AAGAAAATCT CACATTCTTC AGGACTTTTA 9660 

CTAGAGCAAT CGGCTAATTT ACCTGGAAGG CTTGCTACAT CTAACGCTGA TTTACGACGT 972 0 

GTTACTTCAC GCGCTTTTTT CGCAGCAACA CGTGCACGTG CCGCCATAAT ACCTTTTTCA 9780 

ACCACTGTAC GTGCGACTTG TGGATTTTCA TATAAAAATC GTTCAAAGTG CTCTGAGAAT 984 0 

AATTTATCTA CAACTTGACG CACTTCAGAA TTACCTAATT TTGTCTTCGT TTGACCTTCG 9900 

AATTGAGGAT CACCATGTTT GATAGATATA ATTGCTGTCA TACCTTCACG TGTATCTTCA 9 960 

CCAGAAAGTC TATCTTTTTC TTCTTTCATA ATCTTGCTAC TTAAAC CAT A ACTATTTAAG 10020 

ACACG CGTTA ATGCACGTTT GAATC CGTCT TCATGCGTAC CACCTTCATA CGTATGAATG 10 0 80 

TTATTTGCGT AAGTTAAAAG ATTTGTGGCA TATCCTGAGT TATATTGAAT CGCAATTTCT 10140 

ACTTCAATAT CATCTTTAGA TTGATGAATA TAAATTGGCT CATCATGAAT AGGTTCTTTA 10200 

TTTTCGTTCA ATAACTCAAC GTACGATTTA ATACCGCCCT CATAGTGATA GGAGTCTTCT 10260 
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GCAAGCTCTC TAATACGCTG CTGTAATGTT TCATAGTTGT ATACAGTTGT CTCTGTGAAG 10380 

ATTTCTCCAT CTGCTTTAAA ACGAAtGaCA GTACCTGTCT TAtCAGTnGT GCCAACTTCT 1044 0 

TTTAAGTCAA ATTGAGGTAC ACCTTTTTTA TATGCTTGAT GATATATAGT CTCATTTCTG 1050 0 

TGTACATATA CTTCTAAGTC TTGTGACAAT GCGTTTACAA CTGATGAACC AACACCATGT 10 560 

AAACCACCAG ATACTTTGTA TCCGCCACCG CCAAATTTAC CACCAGCATG TAAAACAGTT 10620 

AAAATAACTT CGACAGCTGG ACGTCCCATT TTTTCTTGAA TAT CAACTGG GATACCACGT 10680 

CCGTTATCCG TTACTTTAAT CCAGTTATCT TTTTCAATAA CAACTTCAAT TTGATTTGCA 10740 

TAACCa GCTA ATGCTTCATC GATACTATTA TCGACAATTT CCCACACTAA ATGGTGCAAA 10800 

CCTCTCTCTG AAGTCGATCC TATATACATA CCTGGTCTTT TACGTACTGC TTCTAAACCT 10860 

TCTAATACTT GTATTTGCCC AGCACCATAA TTATCCGTGT TGTTTACATC TGACAATGCA 10920 

GTCACCATCG CTTTCTGTTA CTTTATAATT TCACCTTGAT TAATACGATA CAATTTAGCG 10 980 

TTATTCATGA TTTCATGATC AATACCATCT ACAGATGTCG TAGTGACAAA TGTTTGTACT 11040 

TTATGCTGAA TCGTACTTAA TAAATGCGTT TGACGCGAAT CATCTAATTC ACTGAGTACA 11100 

TCGTCTAATA ATAAGATGGG ATATTCCCCA ACTTCGATAT TCATTAACTC AATTTCAGCT 11160 

AATTTAATGG ACAAAGCCGT TGTACGTTGC TGTCCTTGAG AACCATATGT TTGAG CATCC 11220 

ATGCCATTCA CATCAAAACT TATATCATCT CGATGTGGTC CGAATAAGCT AATGCCTCGT 112 80 

TCTTTTTCTC TTTGCATATT ATCGCTAAGA ATAGACATAA TTTCTTCAAG TCGTGCCGCT 11340 

TCATTTTGAG CATAATCAAA TTTAAGACTA GGTAAATAAT TCAG CGACAA CGCTTCTTTA 114 0 0 

TCATTTGTGA TACCAGCATG AAT CGGTTTA GCTAACGACT CTAGCTCTTG AATAAAATGT 114 60 

GCACGTTTAT CAGTTACTTT CATTGCATAT TCAGCAAACT GCTGATTTAA TACTTCCAAC 11520 

ATTGTTAAGT CCTTTTTTTG GCCTAATTGT AACTGCTTTA AGTAATTATT CTTTTGCTTT 11580 

AAAATACGTT GGTATTGAGC TAAATCATTT AAGTAAACAG CAGAAATTTG GCCCAACTCC 1164 0 

ATATCTATAA AGCGTCGTCT TATTtGrGGr GAGCCTTTTA CAATATTCAA ATCTTCTGGC 11700 

GCAAATAGAA CCACATTGAG GTGTCCAATA TATTGAGTTA GACGACTTTG CTCTAAGTGn 117 60 

ATTCACTTTG GACTTGTTTA CCTTTnTTAG TTATAAACAT TGTTAATGGG CATCGTGCCG 11820 

TGT 11823 
(2) INFORMATION FOR SEQ ID NO: 13 7: 

Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 692 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 137: 

ATAATTATTA ACATGGTGTG TTTAGAAGTT ATCCACGGCT GTTATTTTTG TGTATAACTT 6 0 

5 

AAAAATTTAA GAAAGATGGA GTAAATTTAT GTCGGAAAAA GAAATTTGGG AAAAAGTGCT 120 

TGAAATTGCT CAAGAAAAAT TATCAGCTGT AAGTTACTCA ACTTTCCTAA AAGATACTGA 180 

^ GCTTTACACG ATTAAAGATG GTGAAGCTAT CGTATTATCG AGTATT CCTT TTAATGCAAA 24 0 

TTGGTTAAAT CAACAATATG CTGAAATTAT CCAAGCAATC TTATTTGATG TTGTAGGCTA 300 

TGAAGTTAAA CCTCACTTTA TTACTACTGA AGAATTAGCA AATTATAGTA ATAATGAAAC 360 

15 TGCTACTCCA AAAGAAACAA CAAAACCTTC TACTGAAACA ACTGAGGATA ATCATGTGCT 420 

TGGTAGAGAG CAATTCAATG CCCATAACAC ATTTGACACT TTTGTAATCG GACCCGGTAA 4 80 

CCGCTTTCCA CATGCAGCGA GTTTAGCTGT GGCCGAAGCA CCAGCCAAAG CGTACAATCC 54 0 

20 mTTATTTATC TATGGAGGTG TTGGtTTAGG aAAAACCCAT TTAATGCATG CCATTGGTCA 6 00 

TCATGTTTTA GATAATAATC CAGATGCCAA AGTGATTTAC ACATCAAGTG AAAAATTCAC 660 

AAATGAATTT ATTAAATCAA TTCGTGATAA nA 692 

25 (2) INFORMATION FOR SEQ ID NO: 138: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7900 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION : SEQ ID NO: 138: 



ATACTGTAGC GCAAATTTCA 


CAATGGCATG 


TTATAGAAGA TTTAGTTACG AATGAATTAG 


60 


GTATTAGTAT TTTACCAACA TCAATTTCAG 


AgCAACTAAA TGGAGATGTG AAGCTGtACG 


120 


CATTGAAGAT GCTCATGTAC 


ATTGGGAATT 


AGGTGTTGTT TGGAAGAAGG ATAAACAATT 


180 


AAGTCATGCC ACAACGAAAT 


GGATAGAATT 


TTTGAAAGAC CGTTTAGGCT AACATATTAA 


240 


TAAAGCACTC ATTATTTAAG 


GCGCAT CATT 


ACGTGGGTCA TTGAAATAAT GAGTGTTTTT 


300 


TTGTGAAAAT GAAGTGAAAT 


TTAGAGAGCG 


TTTCCATAGA AAATAGTAAT ACAAACTATA 


360 


AAAAAAGAGT ATTTTTATAT 


TGTGTACGCC 


ATCTTTATAA TAGTTATTGT AACAATTTAG 


420 


ACATATTTAG AAAGGGATGG 


CGCCATGCAC 


AAAGTCCAAT TAATAATCAA ACTACTACTA 


480 


CAACTAGGAA TCATCATTGT GATTACTTAT 


ATTGGCACAG AAATTCAAAA GATTTTTCAT 


540 
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ATTGTACCGC 


TAACTTGGGT AG AAGAC GGT GCAAACTTTT TATTAAAGAC 


GATGGTCTTT 


660 




TTCTTCATAC 


CGTCAGTTGT AGGtATTATG GaTGtgCTTC CGAAATTACG CTAAATTATA 


720 


5 


TACTCTTTTT 


CGCAGTCATT AT CATAGGAA CATGTATCGT TGCATTATCT 


TCAGGTTATA 


780 




TTGCTGAAAA 


AATGTCyGtT AAACwTAAAC AT CGTAAAGG TGTAGACGCt TATGAATGAT 


840 




TACGTGCAAG 


CCTTATTAAT GATTTTGTTG ACTGTCGTTT TATATTATTT 


CGCTAAAAGG 


900 


10 


TTACAACAAA 


AATATCCGAA CCCATTTTTG AATCCAGCAT TAATTGCATC 


TTTAGGAATT 


960 




ATTTTTGTCT 


TACTTATCTT TGGAATTAGT TATAACGGGT ATATGAAAGG 


TGGCAGTTGG 


1020 




ATCAACCATA 


TTTTAAACGC AACGGTCGTA TGTTTAGCGT ACCCACTTTA 


TAAAAATAGA 


1080 


15 


GAGAAAATTA 


AAGACAATGT CTCTATCATT TTTGCAAGTG TATTAAcTGG 


CGTCATGCTG 


1140 




AATTTCATGT 


TAGTGTTCTT AACACTTAAA GCATTTGGCT ATTCTAAAGA 


CGTCATTGTA 


1200 




ACGTTATTGC 


CCCGATCTAT AACAGCCGCA GTAGGTATCG AAGTGTCACA 


TGAACTAGGT 


1260 


GGTACAGATA 


CGATGACCGT ACTTTTTATT ATCACAACGG GTTTAATCGG 


TAGTATTTTA 


1320 




GGTTCGATGT 


TATTAAGATT TGGAAGATTT GAATCTTCTA TCGCCAAAGG 


ATTAACGTAT 


1380 


25 


GGGAATGCGT 


CACATGCATT TGGCACAGCT AAAGCACTAG AAATGGATAT 


TGAATC CGGT 


1440 




GCATTTAGTT 


CAATTGGGAT GATTTTAACT GCAGTTATTA GTTCAGTGTT 


AATACCTGTT 


1500 




CTAATTTTAT 


TATTCTATTA ATTTAGATAT TTAAAATGAT AGACAGAAAG 


GGAGGCTATT 


1560 


30 


AGTAATAATG 


GCAAAAATAA AAGCAAATGA AG CATTAGTT AAAGCATTAC 


AAGCaTGGGA 


1620 




TATAGAT CAC 


TTGTATGGTA TTCCAGGAGA CTCAATCGAC GCATAGTCGA TAg TTTACGT 


1680 




ACAGTGAGAG 


ATCAATTTAA ATTTTATCAT GTACGTCATG AAGAAGTAGC 


AAGCTTAGCG 


1740 


35 


GCTGCTGGTT 


ACACAAAATT AACTGGTAAA ATCGGTGTGG CATTAAGTAT 


CGGTGGCCCT 


1800 




GGTTTAATTC 


ATTTATTAAA TGGTATGTAT GATGCCAAAA TGGATAATGT 


ACCGCAATTA 


1860 




ATATTATCTG 


GACAAACGAA TAGTACAGCA CTTGGAACGA AAGCATTCCA 


AGAAACAAAT 


1920 


40 


TTACAAAAAT 


TATGTGAAGA TGTAGCCGTT TATAATCACC AAATTGAAAA 


AGGTGACAAT 


1980 




GTGTTTGAAA 


TCGTTAACGA AGCAATTCGT ACGGCATATG AACAAAAAGG 


TGTAGCTGTT 


2040 




GTTATTTGTC 


CTAACGACTT ATTAACTGAA AAAATTAAAG ATACAACGAA 


TAAACCAGTA 


2100 


45 


GATACATCAA 


GACCAACAGT AGTATCACCA AAATATAAAG ACATCAAAAA 


AGCGGTTAAA 


2160 




CTAATTAATA 


AAAGTAAAAA GCCTGTCATG TTAATTGGTG TAGGTGCGAA 


ACATGCGAAA 


2220 




GATGAGCTAC 


GTGAATTTAT TGAAATGGCT AAAATTCCTG TCATTCATTC 


ATTACCAGCT 


2280 




AAAACAATCT 


TGCCGGATGA TCAT CCATAT AGTATCGGtA ACTTAGGTAA AATCGGTACC 


2340 
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CCATATGTGG ATTACTTACC TAAGAAAAAT ATTAAAGCCA TTCAAATTGA CACAAATCCT 24 60 

AAAAATATCG GACATCGTTT CAATATTAAT GTAGGAATTG TTGGAGATAG TAAAATTGCG 2 520 

5 TTGCATCAGT TAACTGAAAA TATTAAACAT GTTGCTGAAA GACCATTCTT AAACAAAACG 2 5 80 

TTAGAACGTA AAGCGGTTTG GGATAAATGG ATGGAACAAG ATAAAAATAA TAATAGTAAA 264 0 

CCATTACGTC CAGAACGATT AATGGCATCA ATCAATAAAT TTATTAAAGA TGATGCAGTG 27 00 

10 ATTTCAGCAG ATGTAGGTAC AGCAACAGTT TGGTCAACTC GATACTTAAA CCTTGGTGTA 2 76 0 

AATAACAAGT TCATCATTTC AAGTTGGTTA GGTACAATGG GTTGCGGTCT TCCAGGTGCA 282 0 

ATTGCATCAA AAATTGCATA TCCAAATAGA CAAGCCATCG CAATTGCTGG TGACGGTGCA 2880 

' S TTCCAAATGG TAATG CAAG A CTTCGCTACA GCAGTACAAT ATGATTTACC TTTAACTGTA 2 94 0 

TTTGTACTTA ATAACAAACA GTTAGCATTT ATTAAATATG AACAACAAGC AGCTGGTGAA 3 000 

TTAGAATATG CAGTTGATTT TTCTGATATG GATCATGCAA AATTTGCTGA GGCAGCAGGT 3060 

20 

GGTAAAGGTT ATACAATTAA GAGTGCTAGC GAAGTAGATG CTATAGTCGA AGAGGCATTA 312 0 

GCACAAGATG TACCAACGAT TGTAGATGTA TATGTTGATC CTAATGCTGC GCCATTACCA 318 0 

GGTAAAATTG TAAATGAAGA AGCGCTTGGT TATGGTAAGT GGGCATTTAG ATCAATTACT 324 0 

25 

GAAGATAAAC ATTTAGATTT AGATCAAATT CCACCAATTT CAGTGGCAGC AAAACGTTTC 3300 

TTATAACTGA TTTAAAGGTT AT CACAATTG AATTGAACTA TAAAAACGGT AATTTCTATT 336 0 

^ TCAACAAAAT GGGAATTGCC GTTTTGTTTA TTTATCACAA ATGATCGTAC TGAATTGATG 3420 

ATAAAATTGT GAAAAAGTTG TTGAAAACGC TTTTACAAAT ATGTATAATA GCTATGAATT 34 80 

AGATATCACT TGCGTGTTAC TGGTAATGCA GGCATGAGCA AACAACCGCA CTATGAGAAT 3 54 0 

35 AGTCTTGTTT GTTCATGCCT GCTTTTTTTG TACATGGAAG CGGAAATTGA GATAGGGGAT 3600 

GTTTfiTATGT TTAAGAAATT GTTTGGACAA TTGCAACGTA TCGGTAAAGC ATTAATGTTA 3660 

CCTGTTGCGA TTTTACCAGC AGCTGGTATT TTATTAGCGT TTGGTAACGC AATGCACAAC 3 720 

40 GAACAATTAG TAGAAATTGC ACCATGGTTA AAAAA CGATA TCATTGTAAT GATTTCGTCG 3 780 

GTCATGGAAG CAGCAGGACA AGTTGTATTT GATAACTTGC CATTATTATT TGCAGTTGGT 3 840 

ACAGCACTTG GATTAGCAGG AGGAGACGGT GTTGCAGCAT TAGCAGCGCT AGTAGGTTAC 3 900 

45 TTAATTATGA ATGCAACAAT GGGGAAAGTG TTGCACATTA CAATTGATGA CATTTTCTCA 3 960 

TATGCCAAAG GGGCAAAAGA ATTAAGTCAA GCAGCGAAAG AACCAGCACA TGCTTTAGTA 4 020 

TTAGGTATTC CAACGTTACA AACGGGTGTG TTTGGTGGTA TTATCATGGG TGCTTTAGCC 4 0 80 

50 GCATGGTGTT ACAACAAATT TTATAATATT ACACTACCAC CATTTTTAGG ATTCTTTGCA 4140 
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AGCTTTGCGT 


GGCCACCAAT 


TCAAGATGGA 


TTAAATAGTT 


TATCGAATTT 


CTTATTAAAT 


4260 




AAAAATTTAA 


CATTAACAAC 


GTTTATATTC 


GGTATTATTG 


AACGCTCATT 


AATTCCATTT 


4320 


5 


GGTTTACATC 


ATATTTTCTA 


TTCACCGTTC 


TGGTTTGAAT 


TCGGAAGTTA 


TACAAATCAC 


4380 




GCAGGTGAAT 


TGGTTCGTGG 


TGACCAACGT 


ATTTGGATGG 


CACAATTGAA 


AGATGGCGTA 


4440 




CCATTTACTG 


CTGGTGCATT 


TACTACTGGT 


AAATATCCAT 


TTATGATGTT 


TGGTTTACCA 


4500 


W 


GCGGCGGCAT 


TTGCTATTTA 


TAAAAATGCA 


CGACCAGAAC 


GTAAAAAAGT 


CGTGGGTGGT 


4560 




TTAATGTTAT 


CAGCAGGATT 


AACTGCATTT 


TTAACTGGTA 


TCACTGAGCC 


ATTAGAATTT 


4620 




TCATTCTTAT 


TTGTAGCACC 


AGTACTTTAT 


GGAATTCACG 


TATTATTAGC 


TGGTACATCA 


4680 


15 


TTCTTAGTAA 


TGCATTTATT 


AGGCGTTAAA 


ATTGGTATGA 


CATTCTCAGG 


TGGTTTCATA 


4740 




GATTATATTT 


TATATGGTTT 


ATTAAACTGG 


GATCGTTCAC 


ACGCATTATT 


AGTTATTCCA 


4800 




GTCGGTATTG 


TATATGCTAT 


CGTGTATTAC 


TTCTTATTCG 


ACTTTGCAAT 


TCGTAAGTTT 


4860 




AAATTGAAAA 


CACCAGGTCG 


TGAAGATGAA 


GAAACTGAAA 


TTCGTAACTC 


TAGTGTCGCA 


4920 




AAATTA CCAT 


TTGATGTCTT 


AGATGCAATG 


GGTGGAAAAG 


AAAACATTAA 


ACATTTAGAT 


4980 


25 


GCATGTATTA 


CACGTCTACG 


CGTAGAAGTG 


GTTGATAAAT 


CAAAAGTAGA 


TGTAGCAGGT 


5040 


ATTAAAGCTT 


TAGGCGCATC 


AGGTGTATTA 


GAAGTTGGAA 


ACAATATGCA 


AGCTAT CTTT 


5100 




GGTCCAAAAT 


CAGATCAAAT 


TAAACATGAT 


ATGGCCAAGA 


TTATGAGTGG 


TGAAATTACG 


5160 


30 


AAACCAAGTG 


AAACGACAGT 


GACTGAAGAA 


ATG TCAGATG 


AACCAGTTCA 


CGTAGAAGCA 


5220 




CTTGGAACAA 


CAGACATCTA 


TGCACCAGGT 


ATCGGTCAAA 


TCATTCCATT 


ATCAGAAGTA 


5280 




CCTGATCAAG 


TATTCGCTGG 


TAAAATGATG 


GGTGATGGTG 


TTGGCTTTAT 


CCCTGAAAAA 


5340 


35 


GGTGAAATTG 


TAGCACCGTT 


TGATGGTACA 


GTGAAAACAA 


TCTTCCCTAC 


GAAACATGCG 


5400 




ATAGGATTAG AATCTGAAAG TGGCGTCGAA GTACTTATTC ATATTGGTAT CGATACAGTG 


5460 




AAACTGAATG 


GTGAAGGATT 


CGAAAGTCTG 


ATTAACGTTG 


ATGAAAAAGT 


AACACAAGGT 


5520 


40 


CAACCATTAA 


TGAAAGTGAA 


TTTAGCATAC 


TTGAAAGCAC 


ACGCACCAAG 


CATCGTTACA 


5580 




CCAATGATTA 


TTACAAATCT 


TGAAAATAAA 


GAACTTGTCA 


TTGAAGATGT 


ACAAGATGCT 


5640 




GATCCAGGTA 


AGCTAATTAT 


GACAGTCAAA 


TAATGATTAA 


AAATGAAACA 


GCATATCAAA 


5700 


45 


TGAATGAACT 


TTTAGTCATT 


CGTAGTGCGT 


ATGCGAAGTA 


GCGAGTTGAA 


AGAGAATACG 


5760 




TTACAAAAGG 


CAGTAGCTTA 


AAATGAAGCT 


ACTGCCTTTT 


TAGTGCGCAA 


TGATGTATAG 


5820 




CAGGTGTGTT 


GATGrTAATA 


AGTTAAATAT 


TAGTGTTAGA 


TATAGAAAAC 


ATTGCTTATG 


5880 


SO 


TTTTTGTCAC 


ATTTTAGAAA 


AATGCATCTT 


CGCGACTAGC 


CAAATTAATA 


GTCTCATTGA 


5940 
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AATAAATTAA 


CATGATTTTA AATCTATTTG 


TAAGATAAGG 


AGATTTGTCA 


TTATGACAAC 


6060 




AGAAGGTCTA 


TTAGTTGCAG AGAAAGAAAT 


CGAAGTGAAT 


GGTTACGACA 


TTGATGCGAT 


6120 


5 


GGGTGTCGTT 


AGTAATATCG TTTATATTAG 


ATGGTTCGAA 


GATTTGAGAA 


CAGCGTTTAT 


6180 




TAATCAGCAC 


ATGAATTACT CAACAATGAT 


CAATCAAGGC 


ATTTCAC CTA 


TACTTATGAA 


6240 




AACGGAAGCA 


GAGTATAAAG TACCTGTCAC 


AATACATGAC 


AAACCAGTAG 


GTCGTATTTA 


6300 


w 


CTTAGTTAAA 


GCAAGCAAGA TGAAATGGGT 


GTTTCAGTTT 


GAAATTGTGT 


CCGCACATGG 


6360 




CGTGCATTGT 


ATTGGTACAC AGACAGGCGG 


TTTTTACAGA 


TTGAGTGATA 


AGAAGATAAC 


6420 




CTCTGTGCCA 


CAAGTGTTTC AAGACATTTT 


AGCAACAAAA 


TAATGACTTC 


ATTTTAAAAT 


6480 




ATAAAAAGTA 


AGAAGGTGTT CGAAATGGTT 


AAGCAATTAA 


ATAGTGTCGA 


AGCATTCCGT 


6540 




GAATTTATTC 


ATCAATATCC GTTAGCAGTT 


GTACATGTCA 


TGCGCGATCA 


GTGTAGCGTG 


6600 




TGTCATGCCG 


TTTTACCACA AATTGAAGAC 


TTGATGCAAT 


CATATCCCAA 


TGTGCCATTA 


6660 


GCTGTGATTA 


ATCAAAGTCA GGTGGAAGCT 


ATTGCTGGAG 


AATTAAATAT 


TTTCaCTGTA 


6720 




CCTGTGGATT 


TAATTTTTAT GAATGGAAAA 


GAAATGCATC 


GTCAAGGGCG 


TTTTATCGAT 


6780 


25 


ATGCAACGTT 


TTGAACATCA TCTTAAGCAA 


ATGAATGATA 


GTGTAAATAA 


CGATGTCGAT 


6840 


GAGCATTAAT 


ATCG CAAATG ATTAGCATTG 


CTAAGATTAT 


GTAGACATCA 


TAACTTATTT 


6900 




CCCAGTAAAT 


ATTGGTAGTA ATTAGAATCA 


GCATGGTACA 


GTAGAACTAT 


AGTAGAAATC 


6960 


30 


ATCAAAGAGG 


AGTGACGACA AATGCGTAAA 


AAATGGTCTA 


CACTTGCGTT 


TGGATTTTTA 


7020 




GTTGCAGCAT 


ACGCACATAT TAGAATTAAA 


GAAAAACGCA 


GTGTGAAAAG 


TTATATGTTA 


7080 




GAACAAGGTA 


TACGATTATC TAGAGCTAAG 


CGTCGTTTTA 


TGTATAAAGA 


AG AAG CGATG 


7140 


35 


AAAGCATTAG 


AAAAAATGGC GCCACAGACA GCAGGCGAAT ATGAGGGAAC 


CAATTATCAG 


7200 




TTTAAGATGC 


CAGTAAAAGT GGATAAGCAC 


TTCGGTTCAA 


CCGTTTATAC 


CGTTAACGAT 


7260 




AAACAAGATA 


AGCATCAACG CGTTGTATTA 


TATGCACATG 


GAGGCGCATG 


GTTCCAAGAC 


7320 


40 


CCACTCAAAA 


TTCATTTCGA ATTTATTGAT 


GAACTTGCAG 


AAACACTCAA 


TGCTAAAGTC 


7380 




ATCATGCCAG 


TATAT CCGAA GATTCCGCAT 


CAAGATTATC AAGCGACGTA 


TGTGCTTTTT 


7440 




GAAAAGTTGT 


ACCATGATTT ATTGAATCAA 


GTAGCAGATT 


CTAAACAAAT 


CGTTG TAATG 


7500 


45 


GGTGACTCTG 


CGGGCGGTCA AATTGCTTTA 


TCATTTGCTC 


AATTGTTAAA 


AGAAAAACAT 


7560 




ATTGTGCAAC 


CAGGACATAT TGTATTAATT 


TCACCAGTTT 


TAGATGCAAC 


GATGCAGCAT 


7620 




CCTGAAATTC 


CTGACTACTT AAAGAAAGAC 


CCAATGGTAG 


GTGTGGATGG 


CaGTGTGTTC 


7680 


50 


TTAGCTGAAC 


AATGGGCAGG GGACACACCT 


TTAGATAACT 


ACAAAGTATC 


ACCAATTAAT 


7740 
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CCAGATGCTT TGAACTTATC GCAATTGTTG AGTGCGAAAG GTATCGAACA TGACTTTATA 78 6 0 

CCTGGATATT ACCAATTCCA TATTTATCCA GTATTTCCGA 790 0 
(2) INFORMATION FOR SEQ ID NO: 139: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13 9: 

GTCTAAATAA ACAAAATTAT CATTGATTaC TGAACTGGCA TTTCGAAGTA ATGCTTCAAT 60 

ATCATTCGAA TATTTCTTCA ATTTATGATT GTGAAATAAT TCTTGCATCA AAAATGGTCT 120 

TTGGTCACAT GAATGTGCAT CTGAAGCTAC AAAATGAGCC AAATTACATT CTATAAATTG 180 

TAATGATAAC TTTTGAATGT TTTTACCAAA TCCACCAACT AAAGAACTCG ATGTTAATTG 240 

ACTCAGTGCC CCATTTGCAA CCAATTCATA TAATATTTCC GGATTTTTGG CGATACTTCT 300 

ATTTCTTTCA GGATGTGCAA TGATTGGTAT GTAACCTCTC GATTGTATTT CAAAAAACAA 360 

TTGTTTTGTA TAATGTGGTA CTTCGCCCGT TGGAAATTCA ATTAATAAAT ATTTCGAACG 420 

ATTAATACCT TGAATACTAC CATTATCTAA GCCTTTCAGA ATCGAATCTG TAATTCTAAT 4 80 

TTCTTGCCCG GGAAATAATT TAATATCCAA TG CTTGAACT TCTGGATGCG TTCTTAACTC 54 0 

CG CCAATTTC ACAAGCACTT GTTGAAATGT ATTATCATAT CTCGGATGCA AATGATGAGG 600 

TGTCGCTACA ATACTTGTTA CACCTTCATC CTTAGCTTGC TTTAATAGTG CAATACTCTT 660 

TTCAATTGTT TTAGGACCAT CATCTATATC AACTAATATA TGGTTATGAA TATCAATCAT 720 

GATTCATCAG TCCCATAATA TGCATAGTAA CTAGCACTTT TATCTTTAGG CATT CTATTT 7 B0 

AAGACTACAC CTAATAATTT AGCACCTGTT GCTTCAATAA GTTCTTTTCC TTTTTTAACT 84 0 

TCATCTCTAT TATTATTTTC CGAATTAACT ACGTAGACAA CATTGCCGGT AAACTTTGAA 90 0 

AATAATTGCG CATCTGTAAC TGTGTTCACT GGTGGCGTAT CGATAATTAC AAAGTTATAA 960 

TTCATCAATA ATGTGTCATA CAAATTTGCA AATGCCCTTG ATGTAATTAA CTCTGACGGA 1020 

TTCGGTGGGA TTGGCCCAGA CGTCAAGACG TCTAAATCTT GAATTTCAGT TGAGATAATA 1080 

CTGTCTTGAT AAGTTGACCA ATTT AG CAAT AAACTTGATA GGCCTTCATT GTTTGGCAAA 114 0 

TTAAAAATAT AATGCTGCGT AGGTTTACGC ATATCCCCGT CTACGATTAG TGTTTTATAA 120 0 

CCTGCTTGCG CATATG CAAC TGCTAAATTT GCTGCAATTG TAGACTTACC TGCGCCTGGT 12 60 
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GATCTTATGC CTCGAAATTT CTCGCTAATA GGTGACTTTG GTTGTTCATG GACAATTAAA 1380 

CTTGATGTAC TTCyTCGTGT ATTCGTCATG GTAATTCCTC GTAAATTAAA ATTTTTGTAT 14 4 0 

TGAACCTAAA ATAGGTAATC CTAGTTGCGA TTCAACATCT TCTTCTGTCT TAATACGCTT 1500 

AT CTAATAAT TCTTTTAAGA AAATAATCAA TATTGCTAAA ACAATACCAA CAATAATGCT 156 0 

GATAACTAAG TTGACAGATA CTATTGGAGA TACTTTTACA GCATTATCAT GTGCTGAGGA 16 20 

AAGTATCGTA ACATTATCAA CACTCATAAT TTTAGGCATG TCATGAGCAA AAACTTTAGA 16 8 0 

TATTTTATTA ACAATTTTGT CAGATTCAGA TTTATTCCCA GTGGTAACTG ATACAGTAAT 174 0 

AATTTGAGAG TTTGTTTGAT TGGTTACTTT TAAAAATGAA TTCAACTCAG CTGTTGAATA 1800 

CTGACCATCA AnTTCTCTAG ATACTTTATC TAGAATTCTA GGACTTTTGA TAATTTCCGT 186 0 

ATATGTATTA ACAGACTGCA AACTACTTTG AACATTTTGG AAAGCTAAAT CACTTGAGGA 192 0 

CTTTTTCATG TTCA CTAATA TTTGAGTAGA AGCAGTATAT TTGTCAGGCA TAACAAAAAA 198 0 

GGTT 1984 

(2) INFORMATION FOR SEQ ID NO: 140: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6272 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 140: 

CAAATCCCTT GGTGATGAtA AAtGtATTGC TGTGTAGCCA AATAAT CTTC GTATATATGA 60 

CTGACGTTCA ACAACAGCTT GCAATCGTTT CGTTGGTACA GTTACTTTCT TCTTGTTAAA 120 

GAGACCATAT TCAATTTTAA GTTGCTCATT TTCAAGCATC ACCGAAAAGC CATAAAATCT 180 

TATCATTGTT ATAATCGTTC CAATAATATA TGCCACTATT AATACTAGTA AAATGATGAT 24 0 

TAATACTGAA ATACTTACAA TTTGAACCCA TTGACTAATT TCATGATTTA GCTTCGACCA 300 

TGGGATCAAC TCTCTTACAG CCCCGTAAAT CGGTACTAAA GCTGCTAACG TTACACCAAT 360 

GGCGCCACTG GTCATTGCCA TAAATAGTGA TTCTTTAAAA TTCAT CTGAT ATATAGGAAT 420 

GCGTTTATTT TTCTGATTAA GCATACTATC AGTGTTCTGC ACTTCATCTA AGCGACCTTC 4 80 

TGCGATGTCT TCCACATTAC CTTCAATGTC ATGATTACAG TTGTCATTCT TCTCAGCACT 54 0 

AGACTTTTGC GCCACTTCTG TCTTCAACTC TGTTTGCAAT TGATCAATAT ATCGTTCAAG 600 

ATATTCACCT TGTTTTTTCG AAATAACACT TAAGACAATA CCATCACTTG GTGTTTTGAT 660 
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AATACGTTTT ATATTTAATT CTTTA CGCTT TTTATTAAAA ATACCTGTTG TTAAAATGAA 7 80 

ATAATTATCC " CAATCCAAT ATCGCGTGTT CATAATTCCG ACAATTTGAG AAATGTATGA 84 0 

TATTAAAAAG AATA CAAAT A CAATACCTAT C CAT AAATAT GATTCGGGAT TCGTATAATC 900 

AAAATCTTTC AATTGAAAGA TAATGAAAAT AAAAAAGACG ACTATGTTTT GTTTGATAGC 96 0 

ATTGATTATG CCATTAAAAT ATGAAATCGG ATGTAATTTT TGAGGTTCAG ACATCACTTT 102 0 

CAACCCCTCT CAAATTCGAC ATAGTTCTCT CTTCGATTAT TTTAACATCG TCATGAGACA 10 BO 

TCATCGGTAA ATAAATAGTA TGACCTGCAG TCATAAATCC AACTTTATAC AAATTAAGCA 114 0 

CTTTACTAAT TGGATTAGAT TTAATCGACA AGTATTGTAA ACGTTCAATT CGACTCGTTT 1200 

CTTCTTTATA TATAAAAAAT GATGTACGAT ATTGTACACT TAGTTGATCA A CTTT AT AAA 1250 

AGCGACAATG ATATTGCCAT AAAGGCTTAA TAAATAATTT TAATGTACTC AGAGCACCTA 13 2 0 

AAACCAACAA AATATAAAGT AAGTAATGTG GCCATTCAAA TCTTAACCAT ATAAAATAAA 13 80 

AAATGACATA CACAGCTACA CTCAATATAA ATTCTAAGCC ATTCGTAATG TAGTAATACA 14 4 0 

ACAATGCTGA CTTAGGACTC TTAGTCAACT TAGTATAATC TGACATATAC CCCTCTCCCC 1500 

AAATAAAAAA TTATACGGAT TTATAATCTA TTTCATTTTA TTTTTATATG ATGATAATTA 156 0 

TAG CATATGG AATATTTCAT GCTAATTTAT TCTTCCTAAA GGTACATCTA AAAATTTAAT 16 20 

TAAGCAGAAA GTGCTTGAAT TGCTAAAAAG ACACCATGTT ATAATTTTAT CAACATGATG 16 80 

CCTTTCATCT ATAATCAATC TTTCATCTTA T CAAGAG CG A TATTTAGTTC AAGCACATTC 174 0 

ACATAATCAT TTGTTAACAC ACCACGCTGC TTACGATGTT GAATCAAGTC GGCCACTCTT 18 00 

GAAGTAGATA CATGACGAGC ATCAGCAATA CGAGGTGCTT GCTTCAATGC ATTTTCGACC 18 60 

GTAATATGCG GATCTAAGCC CGACCCAGAA CTTGTTGCAG CATCTATTGT TACATTTGAA 192 0 

TTCCCAAATT TAACATGATG TTTCATGCGT GCTATTAATT CGGTGTTTCC ATTCGATTCA 1980 

TTACTTCCAC CTGAAGATAC GCCGTTTTTA TATAATTTTT CAGGATTCAT ATTATAATCA 2 04 0 

ACTGCACTCG GTCTCCCGTG AAAATATCGT GTCTCTGTCC AGTGCTGTCC AATCAATTTT 2100 

GATCCAACTA TACGATTGTC ATACGTAATT AAACTGCCAT TTGCTTGTTG ATAAAAAAAT 2160 

ATTTGAC CAA TTAACGTGAT AGCTAACGGG AATAAAAATC CACATAATAC CATAGTTATT 222 0 

ATCGTTAAAC AAATACTATT TCTTATCG TA TTCATGGTAC AGGCTCCTTC CTCTTTACAC 22 8 0 

AAAAAATTGT ACAATCATAT CTATTAATTT AATGCCTAAA AACGGGACGA TTAATCCACC 234 0 

TAATCCATAA AT CAA CAT AT TATTTATAAA GATTCTATCA ATGCTGTAAC CCTTTACTTT 24 00 

TACACCTTTC ATGGCAATTG GAATTAAGGC AACAATGATT AATG CATTG A ATATCAAAGC 24 60 
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AATTGTTGAC ATCATTAGTG CAGGTAAAAT TGCAAAGTAT TTTGCTACGT CATTAGCCAA 2 5 80 

ACTAAATGTC GTTAATGCAC CTCTCGTCAT TAATAATTGT TTGCCTATTT TTACAACCTC 2 6 40 

TATTAACTTT GTAGGATTCG AATCTAAATC AATTAGATTA GCTGCCTCTT TAGCACTAAT 2 7 00 

TGTCCCTGAG TTCATAGCTA AT C CTATATT CGCTTtGTGc tAGCGCAGGT GCATCATTTG 2 760 

TACCATCTCC TGTCATCGCA ACAATATGGC CTTTCGCTTG TTCATCTTTG ATGACTTTAA 2 820 

TTTTATCTTC GGGTTTACAC TCTGCAACAA ATCTATCAAC CCCGGCTTCT TTTGCAATTG 2 8 80 

TAGCTGCTGT TAAAGCATTA TCACCTGTAC ACATAACTGT TTCAATCCCC ATTTTTCTCA 2 94 0 

ATTCAGTAAA TCGTTCTACA AGACCATCTT TAATCACATC TTTTAAATAA ATCACGCCAA 3 000 

GCATGACATT GTTTTCAATG ACTATTAAtG GnGTGCCACC TTTACTCGAT ACATCCATAC 3 0 60 

AGAGAGACTC AATATTAAGA GGAATATTGC CTTGTTGTTG TTTGACAAGA TTTATCATAC 3120 

TATTAGGTGC ACCTTTGAAT ACCGATATTT CATTTGTAAT GATTC CGCTC ATTCTAGTTT 3180 

CAGCTGTAAA AGGCTTATAT GTGCCATCAA TGTCTTTAGG CAGCTCATTT ATATACATc T 3 24 0 

GcttCGCTAA TCGTACAATA CTTTTTCCTT CTGGCGTATC ATCGTAGATT GATGACATAT 3 3 00 

AAGCAGCGAC TATCAATTTT TCAAGCATTT GTTGATTCAC TGGTAAAAAT TCACTAGCGA 3 3 60 

TTCGATTGCC ATAAG TGATT GTG CCTGTCT TGTCTAAAAT CATTACATCG ACATCTCCAC 342 0 

ATACTTCTAC AGCACGCCCA CTTTTCGCTA ATACATTGAA TTGAGTAACA CGATCCATGC 34 80 

CTGCAATACC AATCGCCGAT AACAAACCAC CGATTGTCGT TGGTATTAAA CATACTGTTA 3 54 0 

ACGCAATGAG CATCGCAATA GGTAAAATTA AATGCAGGTA AGATGCTATT GGATATAACG 3 6 00 

TTACAATAAC GACTAAAAAT ATAATTGTTA ACGTTGTTAA TAATGTAAAA AGTGCAATTT 3660 

CATTTG GTGT TTTATTTCTT TCCGCCCCTT CAACTAAGGC AATCATTTTA TCTAAAAAAG 3 72 0 

ATGTACnCGC TTCACTCTCA AC A C GTATTT CTAACCAATC AGATGTTACA AGTGTACCGC 3 78 0 

CAATGACTCC ATCAAAATCG CCA CCTG ATT CTTTTATCAC AGGTG CAGAC TCACCAGTAA 3 84 0 

TTGCAGATTC ATCAACGGTT GCTAATCCAT TTATTACAAC GCCAT CAGCA GGGATTGTTT 3 900 

CTCCATTTTC TACCCGAATA TTTTGTCCGG CTTTTAACTC TGTGGCGTTC ACTATCCGAT 3 96 0 

ACGCACCATT TTCTTCTATC AATCGAGCAG TTAAATTTGA TTGTG CTTGT CTTAAACTAT 4 02 0 

CAGCTTGCGC TTTTC CACGA CCTTCAGCAA AGGCTTCTGA AAAATTAGCA AACAATATAG 4 08 0 

TTATTAATAA TATGATAAAA ATTGTAATCA AATAACCTCG CGATAGATAG CTAGTTCCAA 414 0 

ATATGTCAGG AAAACATATT AATATCAACG TTAAAATCAT TCCAACCTCA ACGACAAACA 420 0 

TTATCGGATT TTTTATTAAT TGTTTAAGAT TCAGCTTATA AAAACTCATT TTCAAAGCTT 4 26 0 
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TTTATTTTAA AGTTAAAAAT TCACCAATAG GACCAAGTAA TAGTACTGGA ATAAATGTCA 4 3 80 

AACCACTTAG TAAAACGATA AATACGATTA GTGATACGCC AAAATAAGGT TTATCAATCG 4 44 0 

CTATTGTATA TTTATCTTGA TGGTATGATT TTTTATTCAC TAAACTTGAT GCAATCATTA 4 500 

ATTGCAAAAT AATTGGTATA TAACGAGAAA GCAACATAAT GATTCCTGTA GAGATATTCC 4 5S0 

AGAATGTTGT ATCATCTTTC AGTCCTTCAA ACCCTGATCC ATTGTTCGCA GCAGCTGATG 4 62 0 

TCATTTCATA CATAACTTGT GAAATACCAT GAAAAGACGG ATTCGTtATa CTTtCACTTG 46 8 0 

CTCCAGGAAT CATAAAAGCA AGTG CTG AAA ATACTAAAAT TAAAATTGGG TGTATGAGAA 474 0 

AGACTAAGAC AATACATTTC ATTTCACGGG CGCCAATTGG CATATTTAAA TATTCTGGTG 4 800 

TTTTACCAAC CATCAAACTG CATATAAACA CCGTCAGTAA GACAAATATC AATAAATTCA 4 86 0 

TGAGTCCTAC GCCTTCGCCA CCAAATACAA CATTTAGCAT CATTAATACC ATTGGTCCTA 4 92 0 

ATCCACCTAT AGG CGTTAAG CTATCATGCA TGTTATTAAC AGAACCCGTT GTAAATGCCG 4 9 80 

TCGTAATAAC TGTAAATAGT GCTGACAAAC CTGCTCCAAA CCGTACCTCT TTACCTTC CA 504 0 

TATTCGGTCC ATAAATGCCT AAATTCGCTA GTATTGGATT ACCACGATAC TCACTCCACA 5100 

TAGTTAATGT AAGAATTGCT ATAAAAATGA AAAACATTGC GACAAATAAT ATCAACGCAT 5160 

GACGATGTAC TCGTTTA CCA TGTCTACTTA ACATGCGACC AAATAAGAAC AACATTGACA 522 0 

TAGGAAGTAA CATCATACTG CCCATTTCTA TAAAATTGCT CCAAATATTT GGATTTTCAA 52 8 0 

AAGGTGTTGC AGAATTTCCT GCTAAAAATC CTCCACCATT CGTACCAAGA TGTTTTATTG 5340 

ATTCAAGTGA TGCAATAGGT CCAAATGCAA TATGTTGAAT ATGTCCGCTT AAAGTCCGAA 54 00 

TCATTAAATT AGCATGCAAC GTTTGTGGTA CaCCTTGAGT CATCAATAAA ATACTAATTA 546 0 

AACATGATAA TGGTAAAAGT ACTCGGACAA TAAAC CGAAC AATATCTTGA TAAAAATTAC 552 0 

CAATGATATT AGTTAATCCA GTTAAACGTC TCAACATCGC TATACAAACG GCGTAACCTG 5580 

ATGCACTAGA TGTAAACATT AAATATGTCA TTACAATCAT TTGCGTTAAA TATGTCACAT 5640 

CTGaTTCACC GTTATAGTGT TGtAAATTAC TATTTGTTAA AAAAGATATT GCTGTATTAA 5700 

ACGCTAAATC TATCGATTGG TTTAAATTAT GATTTGGATT TAAAAAAAGC CATTGCTGAA 576 0 

CTATTAGCAA TACAAATGTT ATAAACCCCA TAAATCCATT AAATGCCAGA AAATGTTTGA 5820 

CATATGTTTT AGCTGACATG TGTTCTAAAT CTGTGCCGAT AATTTTAAAA CACATATTTT 5 880 

CAAATCTAGT AAATATTAAA TCTACTCTTG ACGATTGCAC CAATG CTACG CGATATAGAT 594 0 

ATCCACTAAA AACATACGTA ATCATAACCA TCATTGTTAG AAACAAAATT ATTTCCATGA 6000 

TAACCCTCAC TTAATATATT TCTAAAATTT TTCACTACGA ATTAAGGCAT AAAATAAATA 6060 
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ACACAACAAC ATCGTAACAA CTTGTTTATG AGAGAAATnT TAATTTTCAA ACTTAGTTAT 618 0 

TAAGAAAnCA TTAAGATGTG TATG CAG AAA TAAATTTTAT AG CATTTAAT TGTGAAGAAT 624 0 

ATTATGATAT TGCTATCGAG GTGAAGGTTA TG 627 2 



(2) INFORMATION FOR SEQ ID NO: 141: 

(i) SEQUENCE CHARACTERISTICS: 
io (A) LENGTH: 1978 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 141: 

AAATGATGTT TTACAATAAA TATAnAAACG TATCAACATA TATCATCATA TTTTTAGTTT SO 

20 CAAGTGCAGC CTTTGCAATA TTCTTGTTAA GTGCGnACAT TAGTGCTCAC TCGGAACAAG 120 

TGTACGAAAT GACTGACCAT CAAATTAAGA ACAATACGAT AAATAAAGCA TACGAACATA 180 

AAGACCCTAC AAACAATAGC GAACAAAGAG ATGGGAAAGT GTTCGCTTTA ATAAATTGAT 24 0 

25 ACATTGTCAC AACGTTATTT TG CCTATTTT TGCGmAATAG CGTTTTTTAT TACwTTTTTG 3 00 

CTGATsTTAA ATTTGTTATA TTTTGTTAAA GTATTATAAT GATTGAATAA ACAAATTGAA 3 60 

GGTAGGTTTT TTAATTGAGT AATTCTGATT TGAATATCGA AAGAATTAAC GAGTTAGCTA 420 

30 

AAAAGAAAAA AGAAGTAGGA TTAACTCAAG AAGAAGCAAA GGAGCAAACA GCCTTAAGaA 4 80 

AAGCTTATCT TGAGAGTTTT AGAAAAGGGT TTAAACAACA AATTGaAAAT ACTAAAGTAA 54 0 

TTGATCCAGr AGGTAATGAT GTAACACCTG AAAAAATTAA AGAGATACAA CAAAAAAGAG 6 00 

35 

ATAATAAAAA TTAAATCACA AATCTGTAAA GAATTTTCTG ACATTATAAC TTGAAATAAG 660 

TATTTTACTT ATCTTTTTAT TTTAAAATAA GTTATAATGT ATTTGATAAA ATTGAAGAAG 72 0 

40 GGAAGATACA CAAGATGTTT AATGAAAAAG ATCAATTAGC TGTTGATACG CTACGTGCAC 78 0 

TAAGTATCGA CACAATCGAA AAAGCGAATT CTGGTCATCC AGGATTACCT ATGGGAGCTG 84 0 

CCCCAATGGC TTACACTTTG TGGACACGTC ATCTGAATTT TAATCCACAA TCTAAAGATT 90 0 

45 ACTTCAATAG AG AC CGTTT C GTATTATCTG CAGGGCATGG TTCAGCATTA TTGTATAGCT 960 

TGTTACATGT TTCTGGTAGT TTAGAATTAG AAGAATTAAA GCAATTTAGA CAATGGGGTT 1020 

CTAAAACACC AGGTCATCCT GAATACAGAC ATACAGATGG TGTAGAAGTT ACTACCGGAC 108 0 

50 CACTTGGACA AGGTTTTGCT ATGTCAGTAG GATTAGCTTT ACAGAAGATC ACCTAGCAGG 114 0 

gAAATTTAAT AAAGAAGGAT ATAATGTTGT AGATCATTAC ACATATGTAT TAGCTtCTGA 1200 

55 
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AAGTAAATTA GTTGTTTTAT ACGATTCAAA TGATATTTCA TTAGATGGCG AATTAAACAA 13 20 

AGCT T TTTCT GAAAACACAA AAGCTCGTTT TGAAGCATAT GGTTGGAATT ACTTACTAGT 13 8 0 

5 TAAAGATGGT AATGATTTAG AAGAAATTGA TAAAGCGATT ACTACAGCTA AATCTCAAGA 14 4 0 

AGGACCAACG ATTATTGAAG TTAAAACAAC AATCGGATTT GGTTCACCGA ATAAAGCAGG 15 00 

AACTAATGGT GTTCATGGGG CACCTTTAGG TGAAGTTGAA AGAAAATTAA CATTC GAAAA 15 6 0 

w 

TTACGGTTTA GATCCTGAAA AACGTTTTAA TGTTTCAGAA GAGGTATACG AAATTTTCCA 162 0 

AAATACTATG TTAAAACGTG CTAATGAAGA TGAATCTCAA TGGAATTCAT TATTAGAAAA 16 8 0 

ATATG CAGAA ACATATCCTG AATTAGCAGA AGAATTTAAA TTAG CGATTA GTGGTAAATT 174 0 

15 

GCCTAAAAAT TATAAGGATG AATTAC CACG TTTTGAACTG GGTCATAATG GTGCATCTCG 180 0 

TGCTGATTCT GGTACTGTTA TTCAAGCAAT CAGTAAAACT GTCCCTTCAT TCTTTGGTGG 186 0 

20 ATCAGCAGAC CTTGCTGGTT CAAACAAATC CAATGTAAAT GATGCAACTG ATTATAGTTC 1920 

TGAAACACCT GAAGGtAAAA ATGTGTGGTT TGGTGTACGT GAATTTGCTA TGGGTGCT 19 78 
(2) INFORMATION FOR SEQ ID NO: 142: 

25 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7588 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 142: 
TAGTAG TATT TATTAAATTA TACGAAGGGA CCcAACACAG AAAATTCATT TTATTGAATT 6 0 

35 

TTACATTTAT GTGCCAAGTT GGGAAAAATG TCTTATTTTT TCaAAGTATT TAAAAGTAAA 12 0 

ATTACATGTT AATACGTAGT ATTAATGGCG AGACTCCTGA GGGAGCAGTG CCAGTCGAAG 18 0 

4Q ACCGAGGCTG AGACGGCACC CTAGGAAAGC GAAGCCATTC AATACGAAGT ATTG TAT AAA 24 0 

TAGAGAACAG CAGTAAGATA TTTTCTAATT GAAAATTATC TTACTGCTGT TTTTTAGGGA 3 00 

TTTATGTCCC AACCTTTTTA GAATATTAAA TTTCTACAAT TTCGTCATCT TCAACAATAA 360 

45 AGCCCATTGT ATTGACGCTG TTATTTAAGA AAGTCAGAAT ATAACGCATT ACTTCATCAC 42 0 

GTTCTGGCTC ATTGTGAACC TCGTGGTAAA AACCTTGCCA AGCTTTAAAA TATAATTCAG 4 80 

GTGTTTGATA TTTTTCTTTA AACTCATCAA TTGCCCTAGT ATCAACAATT AAATCCTTCG 54 0 

50 TTCCATACAT TAATAGCGTT GGCATTGGTT GAATGTCATG AATATGAG CC ATCGTATCTT 600 

TCATCGTCTC ATTAATTGTA TTATACCAAT GATACGTTGC TTTTTTTAAC ATTAAACCAT 660 

55 
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CATTAAAACG TGTGTCTTTT GAAATTTTAC CTATATTTGA AACAAGTTTA TCTTTACGAT 78 0 

TTTTTCCATT CTTT TGAAGT TCTAG CAT AG GAGAAATTAA CATCATCCCC TCGATTGGCA 84 0 

ATTCTACTTT TTCAAGTAAA TTTAATAAAA TCAAACCGCC AAGTCCTACC CCTAATACAT 900 

AAGTAGGAAT TTTATATTCA TTAGCTATCT TTAACCAGTC TAGCAAACTT TCGTGATACG 96 0 

TTTGAAAGTT TTCAATTTGT C CTTT ATTAG CTCTTGAAGT TTGACCTTGA CCAGGCAAAT 102 0 

CTCCCATAAT CACATGATAG CCATTTCTTC TTAACATCGT AATAACATAT GCATATCTTC 1080 

CCGTATGTTC TAATATA TTA TGAGCAATAA CAACGACGCC TTTCGCATCA TTTTCAGCTT 114 0 

CCCACTTCCA CATTATTATA CTGCCCCTTT TTCATTAATC TTCAATAACA T AATT AT AG C 1200 

AAATTCACTA TGTAGATTTC TATTTATAGT ATTATTGTTG TCCATATTAT TATATATAAA 1260 

TGAAATCAAC ATCAATAATA GTGTAATTAT ACATAATTAT TTTTGATTGT TTTTGATGAA 1320 

AACGCTTTCT CGAATATTTT TTTCATGCTA AACTTATTGT AAACACAAGG GTTTGGAGGA 1380 

GTAGCAATGG CACTATTAAA GAATTTTTTT ATCGGATTAT CTAATAATAG TTTTTTAAAC 14 4 0 

AACGCAGCAA AAAAAGTGGG CCCACGTTTG GGCGCCAATA AAGTCGTTGC CGGAAATACA 1500 

ATTCCAGAGT TAATTAATAC AATCGAATAC TTAAATGACA AGAATATCGC TGTTACGGTA 1560 

GACAATTTAG GGGAATTTGT CGGTACAGTT GAAGAAAGTA ATCATGCTAA AGAACAAATT 16 2 0 

TTAACAATTA TGGACGCGCT TCATCAACAT GGCGTAAAGG CACATATGTC TGTTAAATTG 16 8 0 

AGTCAGTTAG G TG C AG AATT CGACTTAGAA TTAGCTTACC AAAATTTAAG AGAGATTTTA 174 0 

CTTAAAGCAA ATACTTACAA CAATATGCAT ATAAATATTG ATACTGAAAA AT ATGCT AG C 18 00 

CTGCAACAAA TTGTTCAAGT TTTAGATCGC TTAAAAGGCG AATTTAGAAA TGTTGGTACT 1860 

GTAATTCAAG CATATTTATA CGATAGCCAC GAATTAGTTG ATAAGTACCA AGATTTACGA 1920 

TTACGTTTGG TTAAAGGTGC ATATAAAGAA AACGAATCAA TTGCATTTCA ATCTAAGGAA 19 80 

GACGTAGATG CAAATTACAT CAAAATAATT GAACAACGTT TGTTAAACGC AC GCAATTTC 204 0 

ACTT CAATTG CAACACATGA CCATCGCATC ATTAATCATG TAAAACAATT TATGAAAGAA 2100 

AATCACATTG AAAAAGATCG TATGGAATTC CAAATGCTCT ATGGTTTTAG ATCAGAGTTA 2160 

GCAGAAGAAA TCGCAAATGA AGGCTATAAT TTCACTATTT ATGTAC CTTA TGGCGATGAT 2220 

TGGTTTGCGT ATTTTATGAG AAGATTAGCA GAACGCCCAC AAAACCTATC TCTTG CTGTA 22 80 

AAAGAATTTG TGAAACCTGC TGGCTTAAAA CGTGTTGGCA TAATTG CAGC TTTAG GAG CT 234 0 

ACAGTTATGT TAGGTTTAAG TACAATTAAA AAATTATGCC GTAAATAGAG CAAGACATAA 24 00 

ACAATAATTT AGGAGTCTGG AACAATAATC AATGTTCTAG GCTCCTAAAT GTTATATTGG 24 60 
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TAGATTTTAA 


TAAATTAGCC 


ATTTCAATTG 


CACTTACTGC 


TGCTTCAGCA CCTTTATTGC 


2580 




CAGCTTTCGT 


ACCTGCTCTT 


TCCACAGCTT 


GTTCAATAcT 


TTCAGTCGTT AAAATACCAA 


2640 




ATATGACTGG 


TACATTAGTT TGAT CATTCA CTTTAGAAAC ACCTTTCGCG ACTTCATTAC 


2700 




AAACATAATC 


ATAATGAGAC 


GTAGCACCGC 


GAATTACGCA 


TCCTAATGTA ATTACTGCAT 


2760 




CATAATTTCC 


TGATGAGGCT 


AATTTTTTAG 


CTACTAAAGG 


AATTTCAAAC GCACCTGGCA 


2820 




CAAATGCTAC 


ATCAATATTG 


TCTTCATTAA 


CATCATGTCG 


AATCAAAGTA TCTTTTGCAC 


2880 




CTTCAAGTAA 


TCTTCCAGTG 


ATAAAATCAT 


TAAATCGACT 


AACTACGATT GCAACTTTCA 


2940 


15 


AATCTTTTCC 


AATTAATTTA 


CCTTCAAAAT 


TCATGTTAAA 


ATCCTCCTAT ATTAAATGAC 


3000 


CCATTTTTAT 


TTTTTTCGTT 


TCCATATAAT 


CATGATTATG 


TACCGTTTCT GGTACGATAA 


3060 




CTTCAATTCT 


TTCTGCAATA 


TCAATGCCAT 


ATTGTTTTAA 


TCCCTCAAAT TTACTTGGAT 


3120 


20 


TATTACTTAA 


TAAATTGATA 


TGTTCGATGT 


TAAAATATTT 


TAAAATCTGT GCAGCAATAT 


3180 




GATAATCTCG 


CAAATCTTCA 


TCAAAACCTA ATGCTAAATT 


TGCAGTTACT GTATCATATC 


3240 




CTTGCTCAAT 


TAATTCATAT 


GCGCGTAATT 


TGTTTAACAA 


TCCTATGCCA CGACCTTCTT 


3300 


25 


GAGGTAGATA 


AATAATCATG 


CCACCATGTT 


CATTGATATA 


CTTCATAGAC GATTCAAGTT 


3360 




GAGCACCACA 


ATCACAACGT 


TGACTATGGA 


AAATATCGCC 


TGTAAGgCAC GCAGAATGTA 


3420 




AGCGTACATT 


TTCATGTTGT 


CGAATTGCAC 


CTTTTGTCAG 


TACAACTATC TCTTCATCTG 


3480 




TGTATGTCGC 


TTTAAAACCA 


TACATATCAA 


ATGTTCCGAA 


ATCTGTAGGC ATTTTCACTT 


3540 




TTGCCTTAAA 


TTCAATTTCT 


GGTTCTAATT 


TTTTACGATA 


TTCAATTAAA TCATCAATCG 


3600 




TAATCATCTT 


TAATTGATGT 


TTTTCTTTAA 


ACTTTTGTAA 


ATCTTGTCCT TTCGCCATCG 


3660 


35 


TGCCGTCATC 


ATTCATAATC 


TCACAAATGA 


CACCAGCGGG 


CTTGGCACCA GTAAGTTTAG 


3720 




CTAAATCAAC 


AGCCGCTTCT 


GTGTGTCCAT 


TTCTAGCTAA 


TACGCCTTTA TCTTGTGCTA 


3780 


40 


CTAATGGAAA 


TAAATGACCA GGACGATTAA 


AATCTTTAGC 


TTCACTACTA GGATCAATGA 


3840 




GCTTTTTGGC 


AGTCAATGTA 


CGTTCATAAG 


CACTAATTCC 


TGTTGTTGTA TCTACATGAT 


3900 




CAATACTCAC 


TGTAAATTGC 


GTACCAAAGA 


TGTCGGAGTT 


ATCATCAACC ATTTGTACCA 


3960 


45 


AATCCAAACG 


TTGTGCAATA 


TCTTTAGACA 


CTGGTGCGCA 


TATTAATCCC CtTGCTTCTT 


4020 




TCG CCATAAA 


ATTAATGGTA 


TTATCGTTCA 


TCCATTCAGT 


AACCGCTACT AAATCACCTT 


4080 




CATTTTCACG 


ATTCTCATCA 


TCTACTACAA 


TAATTGGTTC 


TCCATTTTTT AAAGC CATTA 


4140 


SO 


AAGCACTGTC 


AATATTATCG 


AATTGCATGC 


TACCCCTCCt 


AAAAACCAAA TGCTCTTAAT 


4200 




TTATCTACAG 


ATAATTGGTC 


TTTATCTTTA 


TTTAAAATAT 


TTTCAACATA TTTAAACAAA 


4260 
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CTCGTTTCTG GAATAAGATG AATGTCAAAA CTGTTATCAT GCTTATCAAA TACCGTTAGA 4 3 80 

CTAACACCAT CCACAGTAAT AGACCCTTGC TTAACTAACT GATTATTAAT ATGTTGGCTA 4 44 0 

CATTGAATCG TAATAATTTT TGCATTGGCT GTTTCATTTA TTTTTGAAAC TGTTCCTAGT 4 500 

TCATCTACAT GACCGAGGAC AAAATGTCCA CCAAACCTAC CGTTACCACT CATGGCACGC 4 56 0 

TCTAAATTTA CTT CTGATTG TCGCTTAACA TCTGCTAAAT AGGTTTTATT TTCAGTGCCT 462 0 

TTAATTACTT GAACAGTAAA AGATGTCTGA TTAAAATCAA TCACTGTTAA ACATGCACCA 4 68 0 

TTAACACTGA TGGAATCACC AATATGCATA TCTGCCGTAA TCTTATGTGC TTCAATTTCA 4 74 0 

ATCGTCCTGA CTGATTGACG AATTTGAACA CTTTTAA CG A CACCTATTTC TTCAACGATG 4 BOO 

CCAGTAAACA TGCATCATCA CTTCTTTCGT AAAGTTAATT TAACATTTTG ATTTAATAAC 48 6 0 

TCGGAATGAA CAATTTCAAA TTGGTTCGCA TCTGGTATCT CAATCACATC ATTTGTTTGA 4 92 0 

TAAAATTGAT AATTTCCAGA TCCGCCAATT AATTTCGGGG CATAATAGAG AATAAATTCA 498 0 

TCTATATAAT TAGATTGGAG AAATTCTGAA GTAGTGGTTG GACCTGCCTC GACTAGCAAA 504 0 

GTTCCAACTC CTCTTTTATA TAAATTGTGA AGAATTGTTG TTAAATCGCA AGACTTCAAG 510 0 

TAAATAATTT CAATATGTGT TTGATTGGTT GTTAAATTTG GATTTTCAGT ATATAT CCAA 5160 

ATTGGTGTTG ATTCATCTTG ATAAATTTGC TGATTAAAAT GAATATTCCC AGACTTAGAC 5220 

AATATTACTT TTATAGGGTT TTTTCCATCT TGAATACGTG TAGTATATTG TGGATCATCT 528 0 

AATTCAACTG TACGTCTTCC AGTTAACACT GCGTCGTGTC GATGTCTTAA CTTATAGACA 534 0 

TCTTGTTTAA CCTCTTTGTT AGTAATC CAT TGACTTTGTC CATTATCATT CGCTTGTTTA 54 0 0 

CCATCTAAAC TTGCAGATAC TTTCACTGTA ATTTGTGGCA GTTGCTTTGC TTTTGCTTTA 54 6 0 

AAAAAGT CTT GGTATAATTG TGATGCCCGT TCATCATCAA CGCATTCAAC CTCAATACCG 55 2 0 

TGAGCCCGTA ACGTCTCATC ACCATGTGTG TCTAACGAAT TGT CTTTTGT TGCGTATACT 558 0 

ACTTTTGCTA TCTTACAATC AATTATTTTG TTAACACAGG GTGGTGTTGA ACCAAAATGA 564 0 

CTACATGGCT CTAACGTAAT ATAAATCGTC GCACCTTCAG CATTTTGTTG TGCCATATCA 570 0 

AGTGCTTGAA CCTCCGCATG CTTGTCACCT TTTCTCAAGT GTGCACCAAT ACCAACAATC 576 0 

CTACCTTCTT TAACTACAAC AGCGCCAACG GGTGGATTAA CACCTGTTTG ACCTTGTACC 582 0 

ATATTTGCAA GTTGAATCGC ATAATCCATA AATTGACTCA AATGATCACC TCTATAAACA 588 0 

AAAATCCTCA CAT CATG AAT TAAGATGCAA GGAGaAAAAT TTATCGTTAA ATAAGCCTAT 594 0 

TTGTACACAT TTTTACAAAT ACGCTACATT ATCTTTGTCG ATAATTAACA TTCTTTCTCC 6000 

CATCCAGACT TTAACTGTCG GCTCTAGAAT CTCACTAGAT CAGCCACTAA TATGAAACAT 606 0 
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TTaTATATGA AATTGTTATA GATTATTTGA GTACGTA GTA TGTCAACTAC ATTTAAAATG 618 0 

ATACTATATG TTTTCTGAAA AAACAATTAA TGACGGTTTT AATTTAATAT AATCTGAGTA 6 24 0 

5 CTATAGGCAT CT CATTGATA TGATTCTTAC TAACAGACAT TAAAATCAAA CCTTCAATTC 63 0 0 

GTCTCTATAG AGCGTTCTCT TTATTATCTT CTAGTTACAA ATTATTGATT GtCACtGCGC 63 6 0 

TGTTGTTGCT CATTCGATTC TAAAGCATCA TATAATTGAG ATACTGTATG CGCAACTTGT 64 2 0 

'° TCTACAATCA TTTTCACACC GTTTCGTAGT TTATTAACA C CGTTTGTCAT TTGACCTATC 64 8 0 

GCAATCATAT TTGTTAATGT TCCAAACCTT GGACTAATAA CTTGATTGGT TTCCGGAATG 6 54 0 

ATTTGTATGC CTCCCATTGG GTGTGCTTGT ACAATTTGTC TATTTTCAAG ATTTCTAATT 6600 

AATTGATCAT CTTGATCCAA TTCATTTAAA TGACTTTTTG CACCTGTCGC GTTAATGACA 666 0 

ACATTATATA TGTCTACTGA TTCTTGGTTT TTGTATGAAA AATAATACAA CTTGCCATaC 672 0 

2Q ATGTTCACAT CTTCTAAATC TTTTTTCAAA ATTAAAGACT TATTTTCTAT TAATTCAATA 67 8 0 

ATTAGTTCAG CAGTTCTTGG AGG CATTGGA TTTGAATTTA ATTGAATCAT CTTTGAGTAT 6 84 0 

TTTTGATTAA ATTGATGTTG GTCTTCAATA CTTAAGCTAT TCCATATCCA ATTTAAATTC 6 90 0 

25 TCTTTCAAAT GTTCAATCAT ACTTTGGAAA ATGCCCaTTT CTGTTGGACG CGCTAAATCA 6 96 0 

TACTTCAAAT CTGCAATATG ATTTCCTGTA CGTCTATGTA CTAATTTTTT AAAATCAATG 7 02 0 

TCATATTCAG CACATTCTTT TAAAAATAAA GAAACTAAAG TATCAAGCGG TGCATTGCCG 70 8 0 

30 AAATGATGTT TTTTAATGTC ATTTAATTTG TCTTTAGTTA AGTACTTGAA TGTCACGTCT 714 0 

ATCATTGTAC CTCTTACACT TGGTAAATGA GCAGAACGAC TCGTCATAGT AATTGGTAAT 72 00 

TTTGGATGAT GAGCAGCAAC ATAACGGACA ACATCTAAAC TGGCAAGGCC TGTACCAATA 7 2 60 

35 

AT CGCAATAT CGTCCAGTTC ATTTACTTCG TCTAACGTAT TATATGTTGG ATAAGG CGTA 7 3 20 

gcGATATATC CTTTTTTACC CTTTAAGTTA TATGGATCAT GGTAGGCAAA TGTACCACAT 7 3 80 

^ GTTAAAAATA CATAATCGTA CGCTTGCCAT GATTGTCCTG AATTTGTAGT ACATATGTAA 744 0 

TAAGTTAAAT TCGTTTCATC GATATTAGAA TTTGTATAAA TCTCTTGAAC TTTATTATAA 75 00 

TTAGTTGATA TATTTGGATA TTTTTTCGTG AACATAGATA AATAAGATTT CATATAATGT 756 0 

4S CCGAATACAA ATCTCGGTAA ATATGCAG 75 8 8 

(2) INFORMATION FOR SEQ ID NO: 143: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10320 base pairs 
50 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 143: 
nCTAGGTATT TTAAACCTAA TCTAGATAAA CTAGCTTCGT AAGCAGCTGC TACATTTTCA 60 

5 CGACCGAAAT CCTCAAAATA TAATTTTGAA GTAATAAATA AGTCTTCTCT AGCAATACCA 12 0 

GTTGACTCCA ATCCGGCACG AATGCCAGCA CCTACTTGTT CTTCATTCCC ATAAACTTTT 180 
GCGGTATCAA TACTACGATA TCCTTGTTCA ATGGCATACT TAACACTTTC CATGCAATTT 24 0 

'° TCATCATTTT CCACACGAAA TGTCCCTAAA CCAATTTGTG GCATCGTGTT TCCATTATAA 3 00 

AATGTTTTAA CCTCCATAAA TATCGCCTCA CCTTTTTGAT GTATTATACC CTGTTAT CAT 360 

AACAAATCTG AGTTGAATAC ATGAGAAAAA ACACTTAGAG CAATCAACCA CTAAAATTCT 420 

15 

AGTAATATCT CTCAAATATT AATCAAATTG TAAAAGTAAT TCTGTTTAAT TTATGACAAA 4 80 

CTAAAAAAGC CGAAGTAACA ACATATAGTC ATCACTTCAG CCTAACATTT AATTGAATGA 54 0 

2Q TTCAATTTTA TCCATCATTT GTTGTAAGTC TTCCACGTTG TATTGAATAC GACCATGGAA 6 00 

TACAAATTTG TTAAAGAACT CGTCTAATTG TTCAGCACCG ACAAGCACTT TGACAGCACT 6 60 

ATTTTGATTA TAATTTGAAA TCGTTACATC GCCTTCATTT TTAAGATTAA AGTATAAAAT 720 

25 TGAAGTTGGT G TATATTTGG CACCTAATTC TTTTTGTAAG TCTTCAGCCA ATTGTTTAAT 7 80 

CGC CTCAATT TGATCTGAAT AATTTACAAA TGATAATGAA CGTTTGTCAT CATTTTGATC 84 0 

CATCACAATA GTTTGCGGTC TAG ATTTAT C TAAATCCAAT GTATCAAATA CTTGTTCCAT 90 0 

30 TGGTGGTAAA TCTTTAAATT GACCGCCACT AATACCATTA TAAACATGAC CTTTTAACAA 960 

TTGAGAATCA ATAATATAAA GACCAGTTCT TGTTAATACT AAATGACTAA TTCGTTCAAT 102 0 

ATTATTAAAG CCATCCTTTG GTAAAAAGAT ATTTGCCATA ATGTGCATAT CTTCTGGTCG 10 80 

AATTCGTTTT TCTTTAACTA ATCTTTCACG AATACCAATT AATCTCATGT CCGTTACATA 114 0 

TTCACTATGA TTTTTCGAGA ACAATTTTAA TGCGTCAATC TCACGATCTT TTGTACTAAC 12 0 0 

CATGTGATTA TAATCTTCTT GTTGTTTTGT AATTGTCTTT TTATTTTGAA TACGCTCTTT 126 0 

40 

CTCTAAAGCT TCTTCATGAG ACTTTTTAAT GTTTTGTTCT TGTTGTTCAT ACTTTTCTTC 13 20 

TGTTTGTCGC TTAACTTTTT TCTTACTACC TAAGGCAACT AAAAAAAGGA CAAAAAAGAT 13 8 0 

45 TAATG CAATG AgCTACTGCA ATAATGAGTC CAATGACTAT CGGTGAAGAT AAATCCATCA 144 0 

CAACAACGCT CCTTTTTAAT ATATGAATAA CTTTAATTAT AATAGAaAAG CTAAAGATTT 1500 

TCGATACATA TTATCATTTA TATACCGAAA ATCTTTTATT TAGCTATATT CAATTCATCT 156 0 

50 TATTATTTTA CTGCGTCTTT TAATTCTTCC ACTTTGTCTA ATTTTTCCCA TGGGAATAAG 162 0 

ACATCTGTAC GTCCAAAATG ACCATAAGCA GCAGTTTGTT TGTAAATCGG TTGTTTCAAA 168 0 
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AGTTGCCCTT CAGAAACTTT ACCTGTTCCA AATGTATCAA TTGCAATTGA CACTGGTTCT 1800 

GCAACACCAA TCGCATATGC CAATTGTACT TCACATTGAT CTG CTAAACC TGCTGCAACA 186 0 

5 ATATTTTTAG CCACATAACG TGCAGCGTAT GCAGCTGAAC GGTCTACTTT TGTAGGATCC 192 0 

TTACCACTGA AGCATCCGCC ACCATGACGT GCATAGC CAC CGTACGTATC AACAATGATT 1980 

TTACGTCCTG TTAATCCTGC ATCACCTTGA GGTCCACCGA TTACAAAGCG TCCTGTAGGA 2 04 0 

10 

TTGATGTAGA ATTTAGTTTG TTCATTAATC AAGTTTTCTG GAACAGTTGG ATAAATGACA 210 0 

TGTGCTTTAA TGTCTTCTTG AATTTGTTCA AGTGTCACAT CCTCAGCATG TTGTGTTGAT 2160 

ACGACAATCG TATCAATACG TACTGGGTTA TCATTTTCAT CATATTCAAC AGTGACCTGA 222 0 

IS 

ACTTTACCGT CTGGTCGTAA ATAATTTAAC GTACCATCTT TACGCACATC TGATAAACGT 228 0 

TTTGCCAATT GATGTGATAA ATAAATTG CT AGAGGCATAT ACGTCTCTGT TTCATTCGTT 2 34 0 

20 GCGTAACCAA ACATTAAACC TTGGTCACCT GCACCTGTTG CTTCAATTTC TTCTTCGCTA 24 0 0 

TCTTTATCAC GATACTCTAA TGCTTTATCC ACGCCTTGTG CAATGTCAGG TGATTGTTCA 24 6 0 

TCAATCGCAG TTAAAATTGC CATTGTTTCA TAATCATAAC CATATTTTGC TCTTGTGTAT 252 0 

25 CCAATTTCTT TAATTGTTTC TCTAACAACT TTCGGAATAT CAACATATGT TGTTGTAGAA 25 80 

ATTTCGCCGG CGATCAATGC CATAC CTGTT GTAACAGTTG TTtCACAAGC TACACGTGCA 2 64 0 

TTTGGATCGT CTTTTAAAAT AGCATCTAAT ATTG CAT CTG ACACTTGGTC AGCGATTTTA 270 0 

30 TCTGGGTGTC CTTCTGTAAC AGACTCTGAA GTAAATAATC GTTTGTTATT TAACATAGTT 276 0 

TGCTCCTTTA AATTTATATT ACGAAAATTC TCTCTCTGTG AG CTAAATAA AAAAG AC CTT 2820 

CTAACTATTA ATATAGAGAG AAGGC CTAAT ACGTCCATTC GCTCTTATCG TTCAGACCTA 28 80 

35 

TTTGTCTGCA AAcGGTTTGG CACCTTTCTT TTATAAAAAA GAGGTTGCTG GGTTTCATTG 2 94 0 

GGTCCATGTC CCTCCACCAC TCAGGATAAG AGAATCCGTT AAAAATAATA GTACCTAATT 3 00 0 

4Q AATGAATTAA TGTCAATTTT TCACAAATAA ATTTACAGTA AAATATTGTA GATTAATTAT 3 060 

GTTAATGTGT TATACTAATT AAATGTAAAG GCTTACATTT AAATTATCGC TTTGGAGGGA 3120 

TTTAGGATGT CAGTAGACAC ATACACTGAA ACAACTAAAA TTGACAAATT ACTGAAAAAA 3180 

45 CCAACGTCAC ATTTTCAACT TTCGACGACA CAACTTTATA ATAAAATCTT AGACAATAAC 324 0 

GAAGGGGTAT TAACAGAACT TGGTGCTGTT AATGCAAGTA CTGGAAAATA TACTGGTCGT 3 300 

TCGCCTAAAG ACAAATTTTT TGTCTCTGAA CCTTCATATA GAGATAACAT TGATTGGGGA 33 6 0 

50 GAAATTAATC AACCTATCGA TGAAGAAACT TTCTTGAAGT TATACCATAA AGTACTAGAC 3 42 0 

TATTTAGATA AAAAAGATGA ACTATACGTA TTTAAAgGcT ACGCTGGTAG CGATAAAGAT 34 80 
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ATGTTTATTA GACC TGAAT C AAAAGAAGAA GCTACAAAGA TTAAACCTAA CTTCACTATC 3 6 00 

GTTTCTGCAC CACATTTTAA AGCAGAT CCA GAAGTTGATG GTACTAAATC TGAAACCTTT 3 66 0 

5 GTCATTATTT CATTTAAACA CAAAGTCATT TTAATCGGCG GTACTGAATA CGCTGGTGAA 3 720 

ATGAAAAAAG GTATCTTCTC TGTAATGAAT TATCTCTTAC CGATGCAAGA TATTATGAGC 3 780 

ATGCATTGCT CAGCAAACGT TGGTGAAAAA GGCGATGTTG CATTATTCTT TGGTCTATCT 3 84 0 

'° GGCACTGGTA AAACAACCTT ATCGGCTGAC CCACACCGTA AACTAATCGG TGATGATGAA 3 900 

CACGG CTGGA ATAAAAACGG GGTCTTTAAT ATCGAAGGTG GCTGCTATGC AAAAGCAATT 3 96 0 

AATCTTTCCA AAGAAAAAGA ACCACAGATT TTTGACGCAA TCAAATATGG TGCAATTTTA 4 02 0 

75 

GAGAACACTG TAGTTGCAGA AGATGGTTCA GTGGACTTTG AAGACAATCG TTATACAGAA 4 080 

AACACGCGTG CCGCTTATCC AATTAATCAC ATTGACAATA TTGTAGTACC AT CTAAAG CA 414 0 

2Q GCACATCCAA ATACAATTAT TTTCTTAACT GCGGATGCAT TTGGTGTTAT TCCACCGATT 4 2 00 

TCAAAGTTAA ATAAAGACCA AGCAATGTAT CATTTCTTGA GTGGTTTCAC TTCTAAATTA 4 26 0 

GCTGGTACAa GCGTGGTGTG ACAGAACCTG AACCATCATT CTCAACATGT TTCGGAGCAC 4 320 

25 CGTTCTTCCC GTTACACCCT ACTGTTTACG CTGATCTATT AGGTGAACTT ATCGATTTAC 4 3 80 

ATGATGTTGA TGTTTAT CTT GTTAATACTG GATGGACTGG CGGAAAATAT GGTGTAGGAC 444 0 

GTAGAATCAG CTTACATTAC ACACGTCAAA TGGTAAACCA AGCGATTTCT GGCAAATTGA 4 50 0 

30 AAAATG CAG A ATATACAAAA GATAGTACGT TTGGTTTAAG CATTCCTGTA GAAATTGAAG 4 56 0 

ATGTACCGAA AACAATTTTA AATCCAATTA ATGCTTGGAG CGACAAAGAG AAATATAAAG 462 0 

CACAAGCAGA AGATTTAATT CAACGTTTTG AAAAGAACTT CGAAAAATTT GGTGAAAAAG 4680 

35 

TTGAACATAT TGCTGAAAAA GGTAGCTTCA ACAAATAAAT TTGAATACTA AATCaAAACC 4 74 0 

ACCGGTGTGA ACGGGTGGTT TGTTCTGCGG CTATAAGCCT TCCTTACTGG CCAGCCCTAA 4 80 0 

AAGGGCACTG ACAAGTCAGC CAACTG CACT ACTATTCCAG CAACCCTAAA GGGTTACTCT 4 860 

40 

TTTTTCTTTC TTTTTTTATT TTTCTCTCCA GTGAAAGGAT CTAAATATTC TTCCATTGAG 4 92 0 

ATTTGGTCTG CAACGATATC CTCTTGTAAT TGATTACGAA TATAATTTTC AATCACTTTT 49 80 

45 TTATTT CTAC CTACTGTATC CACATAAAAT CCTTTACACC AAAACTTTCT ATTTCCATAT 504 0 

CTATACTTTA AGTTAG CATG TCTATCAAAT ATCATTAAAC TACTTTTTCC TTTTAAATAG 5100 

CCAACAAATG ATGATACCCC AAGTTTGGGT GGTATACTAA CTAACATATG GATATGATCT 5160 

50 TTACATGCCT CTGCTTCAAT TATCTCTACA CCTTTTCTTT CACATAATTG ACGCAATATA 522 0 

ATCCCTATAT CTTTTTTTAT TTTTCCATAT ATCACTTGTC TTCTGTATTT AGGTGCAAAG 52 8 0 

55 
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AAATAG CATC TCCTCGTGTT GATTATTTTG GTTGGCTGAC CAATATTTAT TCTAGCACGT 54 00 

AGAGATGCAT TTTTTGTGAC AATGGTAGAA CCTTTTCtGa ACCATACGCA TAGCGTATGG 54 6 0 

TTTTCTTTTT ACAATTAAAG AGCCAACCGT TGTTATAGTC TAACAATGGT TGGCTCCTCT 552 0 

TATTTTATGT GCTAAAAATT TATAGGCAAT TTTATTACAA CAATGTACAT TTAAGGTGAC 5 58 0 

CTTCATGCCA AAATCGCATC ACTCATTTAA TGGAAGCAGC ACGTCTTCAT ATAAAGTACC 564 0 

GATCCCTAAT TCAACGCATG TAGTACCACA TCTTCAAAGC TTGATAGTTC CCATGCGCAC 5700 

ACCACGTTTC ATACTAGCTA TG CGACTCAA CTTGGTTCAT AAACTCTTTA ATATAAGTCA 576 0 

ATGTTTCAAC CATCGCTGGT GGTCTTGGCA CATGTCCTTC TGCCATTTGA TAAAATGTTT 582 0 

CATGCGTGGC ACCTTTTAAC TCTAGTTGGT CCGCTAAATA ATACGCATGA TGAATACCAA 58 80 

CTTGCTGGTC TTTCCCTCCA TGTACAATTA ATATTGGCGG ACTGTTTTCA TTAATGTTTG 594 0 

GAATCGCTTG GCGTGCCTCA TATGCCGCTC GATCTTTTTT CGGATGACCA ATCATTCTTC 60 00 

GTAGCATGCC TCTTAAATCG A CACGTTCTT CATACATTAA ATCAATATCT GAGACACCAC 606 0 

CCCAGATTGT ATAACTTGTT ACTGGTAAGT CTTGAAATGT CAACAATCCT TGTAAACCAC 612 0 

CTCGCGAAAA ACCAACCATG TGGATAAATG CATGTGGATA TTTAT CATGT AGCAACCTTA 6180 

ATAATTGCGT CACATCATTT AAATCGCCAC GGTAAAATTC GTCTTTGCCT TCACTCCCAT 624 0 

TGTTACCTCG GTAGTATGGC C CAATCACTA AAGTTTGACT ATCTGAAAAT TGCATTAATC 6 3 00 

TACCTG CGCG CACACGTCCT ACTTGACCTT TGCCACCTCG CAAATAAACT ACAATG CGAT 636 0 

TTACTTCATG ATGTGGTGTC ATCATTAAAG CTTTTACTTG TAAGTCATCT GACAAATATG 64 2 0 

TAATTTCTTC GAATTGATGC GTAAAATATT CAATTGG CAT TCGTTTACGT TTGATAAAAC 64 80 

CCAAGTGATT GCACCCTCTC TACGCATTTT AAAATGGTAC TATCTTGCAG TAAGAAACTC 6 54 0 

CGTTGTGCGA GTTCAATATC ATTGATACAG TTAAACAACA CTGGCCCTGC TGTTTCTAAA 6 6 00 

TAATCGTTCT TGCTTACCAA TGATTCAACT TCGATAAAAT ATACATCTTT TACAAAATCA 6 6 60 

GTTTGATCAT GTGTTTCAAT GGTATATTGT GCTATGTAAT AAATATTTTT AACTTTGGCG 6 720 

CCTGTTTCTT CATATAATTC aCGTGTAACT GCTTCAGCAC TACTTTCCCC GCGTTCCCTT 6 780 

TTACCACCAG GAAATTCAAT CCCCCGTAAA TTATGTTTGG TAAAAAGCAA TTGATTTTTA 6 84 0 

AACGTTGGAA TAGCTAGCAC ATGATTGCCA TCTGCTATCT CATTAT CCTT TTTAAATGTC 6 900 

AAATTAACTT GACGATTATC TTTATCCCTA AACTTCACGC GCATCACATC CCTACATTGT 6 96 0 

ATGTTAATAT AATAGTTAAT TACTATCGTT GGAGGCATTA ATTATGAAAA AGATATTCTT 702 0 

GGCGATGATT CATTTTTATC AACGTTTCAT TTCGCCACTC ACTCCACCAA CTTGTCGTTT 708 0 
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CCTTTATTTA 


GGTATCCGTC 


GTATTTTAAA 


ATGTCATCCG 


CTTCATAAAG 


GCGGCTTTGA 


7200 




CCCTGTTCCG 


TTAAAAAAAG 


ACAAGTCAGC 


AAGCAAGCAT 


TCACATAAAC 


ATAACCATTA 


7260 




ATATGGTTGT 


AATTGAGTTA 


TATCCACTAA 


AGGGGGGCGA 


AATTCGAGTC 


GCCCCTCTTT 


7320 




TAATATGCCT 


GAATGCGCCA 


CCACATCTTG 


TTCAAAATAA 


TAACCTGCTG 


GTGTAACATC 


7380 




TCCTGGATAA 


TCACCTTTAC 


GAGCAAGCAT 


CGCTGTAAAA 


TAGCGGCTTA 


AACCATATTC 


7440 


w 


GTACATGCCG 


CCAATAACCA 


CTTTTGCACC 


ATGACTTTTC 


AAAGTAT CAA 


TTGCCGTTTG 


7500 




CACTTTATCA 


ATGCCACCTA 


GACGAAATGG 


TTTTAATACA 


ACAACTTTCA 


CATTGTATAA 


75G0 


IS 


TTCTATCAAA 


TTAATTATGT 


CCaAGAACGA 


TGTTGCCTTT 


TCATCAAGGG 


CTATTGGAGG 


7620 




TATTGTTCCA 


TCCGCTACTT 


CATCAAGCAT 


GGAGATATCT 


TTAAATGGCT 


CTTCGATATA 


7680 




AAGAACCTGT 


TCACGCGCTA 


ATAACTGTAA 


CTGTGTGAAA 


TCTTGACGAT 


CCAAGGACTC 


7740 


20 


ATTTGCATCT 


ATAACCAATT 


GAAAGTGAAA 


GTCTAATTCC 


CGTAACACTC 


TAATTTGATG 


7800 




CATGATTTGA 


GGCGTCCATT TTAATTTAAT 


TCTGGTCGGC 


TTTGTTGCTT 


TTAATGACTC 


7860 




TAGTTGTTTA 


TTTGATAAGC 


CGCTCGcTGT 


CGCTCCATAT 


GCTACTGAAA 


ATGAAGGCAG 


7920 


25 


TACATGAAAC 


ATTTGATACA ATGCCATGAC 


AATAGTTGCC 


CTTGCAGCAG 


GCGTATTTTC 


7980 




CAATGAATCT 


ACTAATTTTA 


GTGCTGCTTC 


ATACGTTTCA AATGATTTAT 


TTCTATTATC 


8040 




TTCGAACCAT 


TGCTCAATTA 


CATGTTTCAC 


TGAGGCAATT 


GTTTCATGAT 


CATAC CAATC 


8100 




TGTTTGAAAA 


GCGTTACATT 


CCCCGAAATA 


TGCATTTCCT 


TTGTCATCAA 


TCAATTCGAT 


8160 




AAACAAACAA 


TCACGATGCG 


TTAAAGTGAC 


TTTCGGTGTT 


ACAATTTGTG 


ACTTAAATGG 


8220 




CTCACTATAT 


TTATAAAAAT 


GCAAAGCTGT 


CAACTTCATC 


AAATCATCCT 


CTATACAACT 


8280 


35 


TATTTCTTTG 


TAATTTACCT 


GTTGATGTAT 


AAGGTAAAGT 


ATCAACCTTT 


TCAAAGTGTT 


8340 




TCGGTACTTT ATATTTCGCT AAATGTTGTG ATAAATATGC AATCAATTGT 


GC CTTTG AAA 


8400 


40 


TGTCACTTTC 


ACTGACAAAA 


TATAATTTAG 


GCACTTGGCC 


CCAAGTATCA 


TCAGGATGCC 


8460 




CTACACATAC 


TGCGTCACTG 


ATACCTGGAA 


ATTGctTCGC 


TACCGTTTCA 


ATTTGATATG 


8520 




GATAAATATT 


TTCACCGCCA 


CTAATAATTA 


AATCTTTACG 


TCGGTCATAA 


ATCATGACAT 


8580 


45 


AACCTTCATG 


ATCTATTTCA 


GCAATGTCAC 


CCGTATTAAA 


ATAACCATTT 


TCAAACGTAC 


8640 




CCGTTAAATC 


TGTTGGATAC 


AAATATACAT 


TCATCACATT 


GGCGCCTTTA 


ATCATTAATT 


8700 




CTCCATGACC 


TTCTTTATTA 


GGATTTTTAA 


TTTTTACGTC 


AACATTGGCA 


CTTGGCATCC 


8760 


SO 


CTACAGTGTC 


AGGACGTGCA 


TGCAACATTT 


CCGGTGTTGC 


TGTTAAAAAT 


TGCGAACATG 


8820 




TCTCAGTCAT 


ACCAAATGAA 


TTATAAATTG 


GCAGGTTATA 


TTGTAATGCC 


GTCTCTATCA 


8880 
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AACCTTGTTG CATAAGCCAA TTTAAAGTTT GTGGCACAAG CGAAATGTGC GTGATTCGTT 9 0 00 

CATTTTTAAT CATCGTTAAA ATTTGTTCGG CATTGAATTT ATCAACAATG CG GACAGTAA 9 06 0 

5 AACCTTCAAT AACAGCTCTT AAAAGTACAC TGAGACCCGA AATATGATAA ATCGGCAAGA 9120 

CAGATAGCCA ATTAGTGTCA CGATCAAATC CCAAGCTCTC TTTACATCCG ATTGCACTGG 9180 

CATAATGATT ACGAAACGTT TGTGGCACCG CTTTTTGAGG GCCCGTTGTC CCTGATGTAA 924 0 

10 

ACATAATCGA TGCAATGTCA TCTAAATTAA ATGATGTATT TAATATGTTG GACGGCGACT 93 00 

CTTTCGG CAC CACAGTTTCA TTCGATGTTT CATATTGGAT ACCCATTGTG TTGTC CAACA 93 60 

1S AACTGTTCGT TGTAATATCC CTTCCAGCGA ATTCAATATC ATCCAGCGAT ACAATTTGAA 94 2 0 

ACCCTCGTAA TTCCAGTGGC AAGGTACAAA AAATCAATTG TACATCGATT GACTTCATCT 94 80 

GATTCGTCAT CTCATTAGGT GTCAACCTTG TATTAATCAT CGCAATTTCA ATATTTGCCA 954 0 

20 ACCAACATGC ATG TATT AAA ATGATCGATT GAATCGAATT ATCTATGTAT AGCCCAACAC 96 0 0 

GAGATTGTTG ATAAGCCTTG AGTCTTTTAG CCAATAGACT CG CTTCACAG TATAAATTTT 96 60 

GATAAGTATA AGATTCTTGA CCGTCTGTTA TCGCAATATG ATGTCCATTT TGTTGTGCTT 972 0 

25 GTTTATATAA CCAAAAGTCC ATGCGTTATT CCTCCAAAAT CATTTACATT ATAATTATAA 978 0 

CGATTTTATG ACATTCTAGC AGTGGTTATG TTTAAAAATA TAAAAAAGTA GACGAATTGA 984 0 

TGCATTGATA TGATTGTTAT AATGCTCAAT ACATATCGTT ATATCATTCG TCTACTATTA 99 0 0 

30 

TCAGTTATTT TTATTTAATT TTAGTGTCAT TCTGTCATTT TGATGTGGTG ATTTACCCAT 996 0 

TGTTGCCACA TCATCTGCAA TGTCAATTGG TATACGGTTC ATGTCTTGTA ATGCACTTAA 1002 0 

ATGGAATACT TCATCATCTA AATTTTCAAT GAGATATACA TAATATGTTA CCTTGTCCTT 10080 

35 

TTTATATTTT AACGTTTTCC AAAAGTCCGG CTTGCAATTC AATACATTAT CCGGAATATA 1014 0 

TTCfiATAAAT AAGTAACGTT TGCTGCCTAC TTTGTCTATG AAATATTTTG CAGTGCCTTT 10200 

40 TTCTATACCT CTTATATGTG CATAGTCTGC TGAAAAGTAA ATACTACCTA TTGTTTCATT 10260 

ATGTTGTTGT ATTTCAAATC GTTGGCCTAC TATTTTATTA TTTGTGCTAC nGGGGACTTA 1032 0 
(2) INFORMATION FOR SEQ ID NO: 144: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1477 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 144: 

55 
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GTGTGGATTG 


GATTTTAAAA TCACCCTCAT AAATACTGTC AT CAATATGA TAAGTTACAA 


120 




TTTCACCTAT 


TATTAAATCA GCCCCATCTA ATACATCTCC AAGCAATATC ATTTGCGmTA 


180 


5 


GTTTACATTC 


GAATCTCATT TTCGCATCTT TAATTCCTGG CGTCTTAATC 


GTTGTAGATG 


240 




TTAAAAGTGA 


TAATTCTGTA CGACTCAACT CACTGTCACC ATATGCTAAC 


GGCGCTGCAG 


300 


,0 


TCTCATTAAT 


ATCTTGAACA TTATCTTCGT CTGTAATATG CACAACAAAG 


TCTCCAGTCC 


36 0 




GTTCTATATT 


TAATGCAGTA TCTTTTCTCT TACCTCCTGC ACGTTGAACT 


GCAAT AG CAA 


420 




TCATTGGCGG 


ATGATTATTA ACAATATTAA AAAAGCTAAA TGGTGCTGCA 


TTTACTGATG 


480 


15 


CATCTTGATT 


TAATGTTGTA ACAAAAGCTA TAGGTCGTGG AATAATTGAA 


CCAATTAATA 


540 




ATTTATAGTT 


TTCTCTAGCA GTTAATGATT GTGCATCAAA CGTATACATA 


ATACCTACCT 


600 




CTTTTCTAAG 


TATATCTAGG TATTTCTCCG ATTTTGGTTA ATTTAAACAT 


CTATTCTCCT 


660 


20 


CTGAAAATCA 


CTTGTATTTA TTTAGCAAAT CTTTTGAAAT ATGACACATA 


TGCATATCTT 


720 




CTGGATATTT 


TTCTAAATGT TGCTGATGTT CTTCAGCACT TTTAATGTAG 


TTAGACAGCG 


780 




GTAAGACTTC 


CACTGCAATT TGATCTCTGT CTTTACGTCG TTCAATGAAC 


TGACGCGCTT 


840 




CAATTAAGTG 


GTCATCTACA CAACTATATA AACCCGTTCG ATACTTTTGT 


CCAATATCAT 


900 




TTCCTTGTTG 


ATTCACACTG TAAGGATCAA TGATTTCAAA TAAATAATTC 


ATAATGTCTG 


960 


30 


TAATTGTTAA 


CATACGATCA TCGAAATGAA GTTTGACACA TTCAGCATAA 


CCATCATACG 


1020 


GACCGTCTAA 


TTTAGAGCTT CTTCCATTTG CTCTTCCTGC TTCTGTATGT 


ATAATTCCAG 


1080 




GTATTGTTGC 


AAAAAATGCT TCAACACCCC ATAAACAT CC TCCTGCTACA 


TAAACAACTG 


1140 


35 


CCATATTTAC 


ACCTCATCAT CCTTTTTTAT ATTTTTAACA AGGTTATACC 


ATTTAATACC 


1200 




GCCATGACAT GATTCTGATA CACCTTCATT ACGATACCCA TATTTTTCAT 


AAAATGAAAT 


1260 




TAATGATTCT 


CGACATGTTA ACGTTACACC ATGTCGATGA TGATTCTTAG 


CAAGAG TTTC 


1320 


40 


AAAATAGTTT 


AGTAAGCGAC CTGCAATACC CTGACCTTGA TAATTTGGTG 


CTACAACAAG 


1380 




ACCTAACACA 


CTAATATAGC CACCTTCACT ATTATTTGTG GAGACATTTT 


TAAATAAATC 


1440 




ATCGCTAATG 


TAACGCTCTT TTATGACTGG ACCGTTG 




1477 


45 


(2) INFORMATION FOR SEQ ID NO: 145: 







(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 3976 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 
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AGGTGATTAT CCTAAAAATG CTCATGAGGT CGCTATTAAT GATAAGTTAG CTG CAGACAA 60 

CATTAG AG TC GGGGATAGAT TACATTTTAA AAATAATTCA ACTAGTTATA GAGTTTCTGG 12 0 

TATTTTAAAC GACACAATGT ATGCGCATAG TTCCATTGTG CTATTGAACG ATAACGGATT 180 

TAATGCATTG AATAAG GTTA ATACGGCATT TTATCCAGTG AAAAATTTAA CACAACAACA 24 0 

ACGTGATGAG CTTAATAAAA TAAATGACGT TCAAGTTGTG AGTGAAAAAG ATTTAACAGG 300 

TAATATTGCG AGTTATCAAG CAGAGCAAGC ACCGTTAAAT ATGATGATTG TTAGTTTG TT 36 0 

TGCTATTACA GCAATCGTTC TAAGTG CATT TTTCTATGTT ATGACGATTC AAAAAATATC 4 20 

ACAAATTGGC ATTTTGAAAG CAATTGGTAT TAAGACAAGA CATTTATTGA GTGCGTTAGT 4 BO 

TTTACAAATT TTAACACTAA CAATAATTGG GGTAGGTATT GCTGTGATCA TCATAGTAGG 54 0 

ACTATCATTT ATGATGCCGG TAACGATGCC TTTTTACTTA ACAACGCAAA ATATTTTATT 600 

AATGGTGGGG ATATTTATAT TAGTAG CGAT TTTAGGTGCC TCACTATCAT TTATCAAATT 66 0 

ATTTAAAGTG GATCCTATCG AAGCAATTGG AGGTGCAGAA TAATGGCATT AGTCGTTGAA 72 0 

GATATCGTCA AAAATTTCGG AGAAGGTTTG TCTGAAACAA AAGTTTTAAA AGGTATTAAT 780 

TTTGAAGTGG AACAAGGGGA ATTTGTCATT TTAAATGGTG CCTCTGGTTC TGGGAAAACA 840 

ACATTGCTAA CGATATTAGG CGGATTGTTA AGTCAAACGA GTGGTACAGT GCTTTACAAT 900 

GATGCGCCAT TGTTTGATAA ACAGCATCGT CCTAGTGATT TACGATTGGA AGATATTGGT 960 

TTTATTTTTC AATCTTCACA TTTAGTTCCT TATT TAAAAG TGATAGAGCA ATTGACACTC 102 0 

GTAGGTCAAG AAGCGGGAAT GACCAAACAA CAAAGTTCAA CAAGAGCAAT ACAACTTTTG 1080 

AAAAATATTG GTTTAGAAGA TCGCTTGAAT GTATATCCGC ATCAGTTATC TGGCGGTGAA 114 0 

AAGCAACGTG TTGCGATTAT GAGAG CATTT ATGAATAATC CGAAAATCAT TTTAG CAG AT 12 0 0 

GAGCC CACAG CAAGTTTAGA TGCCGATAGA GCAACAAAAG TTGTTGAGAT GATACGTCAA 1260 

CAAATTAAAG AACAACAAAT GATTGGTATT ATGATTACAC ACGATCGAAG ATTATTTGAA 1320 

TATGCAGATC GAGTGATTGA ATTAGAAGAT GGCAAAATAA CTGATTAGTG GCTTGTAAAG 13 8 0 

ACG CTAAATG TTAATGATTT AAGACATAGT AGTATAAAAG TTAGATAACA GAATACGATT 144 0 

TGGGTTTACA AAAAACAGGC TGGGACATTA AGTTCTTAGG CAATGTAAAA AAGCTGATTT 150 0 

CTATTAATTA TTTGATAGAA ATCAGCTTTT TTGATATGTA TTTTATAATG TACAGCTCGT 1560 

TGCATTCATA TAGCTTGAAG TCACGTTTAA AACCATATCT ATCATTATGG TATGCATATC 1620 

TTTTAAAACC TATTCTTTTG TTATTAGGAC ATATAAATTC ATCATTAAGT TCGTCATATT 1680 

TCCAATTTTG AGTGTTAAAA ATGTCACTTT TAAACTTTCT AGTTTTATCT TTAATAAACA 174 0 
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CACTATCATA ACATGCATCA GCTACAATAT ACTCCGGTAA ATAACCGAAG nTATTTTgAA i86 0 

TCATTGTTAA AAATGGAATT AAAGTTCTAG TATCTGTTGG GTTTTGAAAT AGGTCATAGG 192 0 

5 ATAAAACAAA TTGAGAATTT GTCGCTATTT GTAAATTGTA TCCTGGCTTA AGTTGGCCAA 198 0 

AGTGTCTTAT TTTTTTAAAG TATTTAAAAG TAAAATTACA TGTTAATACG TAGTATTAAT 2 04 0 

GGCGAGACTC CTGAGGGAGC AGTGCCAGTC GAAGaCAGGG GCCCCAACAC AGAArcTGAC 210 0 

to 

ATATAGTCAG CTTACAACAA TGTGCCGGTT GGGGTGGCTG AGACGGCACG CTAGGAAGGG 216 0 

ACCCGTCATC AAAAATTCTA TTTATAGAAT TTTACAGTAA TGTGCCAGAT GGG CAT AG CG 22 2 0 

AAgcCATTCA ATACGAAGTA TTGTATAAAT AGAGAACAGC AGTAAGATAT TTTCTAATTG 22 8 0 

15 

AAAATTATTT TACTGCTGTT TTTTTTAGGG ATTAATGTCC CAGACTCTTT AGTTTATTTA 2 34 0 

TTTTCAATAT AACAATTGTC TAATCAAGGA TTAACGAATA TTTAAAGATA GTTTGACGCA 24 00 

20 ATATTAGAAA CAACCTATAA TAATAGTTTG TTTGTGGATT AACTATTATA AATAAAAGCG 24 6 0 

GCGTAAAGAC ATATAAACCA ACTACTTGAA CAATATAACG TTAATAACAA TCTATACTGA 252 0 

TACATTACGC CTAGATAATC TTTGATGAGC ACATGTAAGA AAAAGTGATA TGGTGTATGA 2 58 0 

25 CTTCCGACAC CATCGATAGA TAAACCTAAT TTTTGGGCTA GTCGTAAGGC GCGCAATACA 264 0 

TGAAACTG A C TTGTt ACACA AACAATTTTA ACTGCTTCAT GATACAAATT GTTGATGATT 270 0 

TGTTTAGAAT ATAAAAAGTT TGTGTATGTA TTTATAGAGT GAGATTCCAT TAGTATATCT 276 0 

30 GTTTTATCAA CACCATGTGC AATCAAATAA CGTTGCATAG CTAAAGCTTC AGAAATTGGT 282 0 

TCGTCTGGTC CTTGTCCGCC AGATACAATG ATCTTTGTTG CTGATGCTTG TTGTTGATAG 2 880 

ATATCAAGTG CACGATCTAA ACGCGCTGCA AGCATTGGTG TGACAAATTC GGTAAAAATA 294 0 

35 

CCAGCACCTA ACACAATTAT GATATCAACT TCTTTGTTGT ATGATCTATG TCTATATGAT 3 00 0 

ACTOTCCAAA CGAGATAACA AATAAAGGTT AGTAACAGGG AAAGACATAA TATAGCTAAC 3 06 0 

4o CACATAGACA AACCTTTCAC AATAGGTGAC TGAATCGTAC TTATAAATAG AAGTGCTGAT 312 0 

GTGTAGAGTA CAAATTTATA TGAAAAAGAT AATAATTTTT TAATAAATAA GCGACTAGAA 3180 

GTATGAGAAA ATAAATATCT ATGTTTGAAT AGCATGATAA TACTGATTAT TATAAATGTT 324 0 

45 ACAAACATAG ACCAAGGGAA AGTATAGGTC ATGATGCTAT AGATGAGTGA CAAAAATATC 33 00 

GATATGACAA CTAAGATGTA GCATGTTAAA TTTAACGTCA GAGTATAGTT GAAAATTAAC 33 60 

GGACAAATAA CGATAAGTAT AAATATTAAT AATAAATTCA ATAACATACT GACACCTCGC 34 2 0 

so TTATAATAAA TATTAAATAT AAATGTAGAT GATTTAATTT ATTAAAGCAA GGAGAAAGCA 34 8 0 

GCAACATGTA AATCTTAATT TGTTATATTA TATATGGGTC AATATTTTTG TGTTTTTTAG 3 54 0 
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TATGGTAAAA CATTTACAAG ACCATATTCA ATTTTTAGAG CAGTTTATAA ATAACGTTAA 3 6 60 

CGCATTAACT GCAAAAATGT TGAAAGATTT ACAAAATGAA TATGAAATTT CATTAGAGCA 3 72 0 

GTCTAACGTA TTAGGTATGT TAAATAAAGA ACCTTTGACA ATTAGTGAAA TCACGCAAAG 3 7 80 

ACAAGGTGTA AATAAGGCCG CAGTAAGCCG ACGAATTAAA AAGTTAATCG ATGCTTAATT 3 84 0 

AGTTAAGTTA GATAAACCAA ATTTAAATAT TGATCAACGT TTGAAATTCA TAAC CTTAAC 3 900 

TGACAAAGGT AgAGCATATT TGAAAGAACG TAATGCGATT ATGACAGATA TTGCGCAAGA 3 960 

TATTACTAAT GATTTA 3 976 



(2) INFORMATION FOR SEQ ID NO: 14 6: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3346 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 146: 



25 


GCTACCTAGG 


CATTTAAGAG 


ATCAAAAAAT 


GTATGAATAT GAACGTTATT 


TTTATGAGCA 


60 




AGAACTTAAT 


GGCGTTGATG 


aAGGGGAAAT 


TTTAAAGAAG TTAAAAGACC 


CACAAGATGT 


120 




TGCAGCTGAA 


AC AAAAG CT A 


GAAGTGTTAT 


TGATTATGCT GAATCTAAAC 


CAACATTTGA 


180 


30 


AAATATTTCA 


AGAGCTGTTG 


CTGCTTCATT 


AAGTTTAGGC ATTCTATCTA 


TTTTTGTCAT 


240 




CCTTATACCA 


GTATCTATAG 


TTGGATTATT 


TGTATTAGCA TTATTTTTAA 


TATCACTTTT 


300 




GCTGCTGTTT 


TGTCCAATTA 


TTTTATTAGC 


ATCAGCAATA TCCAGAGGAA 


TTGTGGACTC 


360 


35 


AATTAGTAAT 


GTATTTTTTG 


C CAT AT CATA 


TTCAGGATTA GGATTAGTAT 


TTATCATTGT 


420 




CATATTTAAG 


ATTTTAGAAT 


ACATTTATCG 


TTTAATCTTA AAATATTTAC 


TTTGGTATAT 


480 


40 


TAAAACTGTC 


AAAGGAAGCG 


TTAGAAAATG 


AAGAAATTCT TTTTTATTGG 


GCTTTTAGTG 


54 0 




TTTGTTGTCT 


TTTTTACAGC 


AGCAACCATT 


ATTTGGTTCA GCTATGATAA 


AAACAAATAT 


600 




GGTACTAAAC 


AATATGATAA 


AACATTCAAA 


gACGATGCTT TTGACAATGT ATCTATAAAT 


660 


45 


TTGGATAGTA 


CAGAACTTCG 


TATAAAACGG 


GGGAATCAAT TTAGAGTTAA ATATGATGGT 


720 




GACAATGATA 


TATTAATTAA 


TATAGTAGAT 


AAG AC GTTG A AGATTAGTGA 


TAAAAGGTCT 


780 




AAGACAAGAG 


GATATGCAAT 


TGATATGAAT 


CCTTTTCATG AGAATAAGAA 


AACGTTAACG 


840 




ATTGAAATGC 


CTGATAAAAT 


GATTAAACGT 


TTAAATCTAT CATCTGGAGC 


AGGAAGTGTT 


900 




AGAATCAGTG 


ATGTTGATTT 


AGAGAACACA 


AGTATTCAAA GCATTAACGG 


TGAAGTAGTT 


960 



55 
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AGTAAAAGTA ACATTAAAAA TAG CAAT ATT AAAGTTGTTA TTGGTACGCT ACAAAT CGAC 


1080 


AAGAGTCAAA 


TTAAACAATC 




AACGATCATG 


GTGACATTGA ATTTAAAAAC 


1140 


ATGCCATCAA 


AAGTAGATGC 


AAAAGCTTCT 


ACTAAACAAG 


GAGATATTCG TTTTAAGTAT 


1200 


GATAGTAAAC 


CTGAAGACAC 


TATACTAAAG 


CTAAATCCGG 




1260 


AAAAATAAAA 


CATTTACTAA 


TGGCAAAGTT 


GG GAAAAG CG 




1320 


ACGATTGATG 


GT AATAT CAA 






TAAGCACCGA TATTAGGAAG 


1380 


CATAATTTC T 






TTGTTGGCAA 


AAGTTAAGTC GGTATCTATA 


1440 


TTGCCAGTAA 


AGTGAGTGAT 




TGACCATCTA 


ACCATGATTT GAAATCTATT 


1500 


ATTTCTGGTG 


GCG CATTTTC 




AAATATGCAG 


TTAATGTTTC AGGTTGATAC 


1560 


ATTGATGTAT 


GGATGGTGCC 




TTGAATAGTT 


TACTGTAAAT TTCATACTGA 


1620 


GGATTATTGA 


ATAACTTAAA 




ATATCTAAAT 


TAT CATT AGT TTGTG AAATG 


1680 


GTACGCG CCA 


GTCTTTCTTT 


AGATTCTTTT 


GTATAATTAC 


GATTTTCATG TGTTAATATT 


1740 


TCAAAATGAT 






CGAACATCTA 


TTGATCTCGG TGTCACTT CA 


1800 


ACAATTGCAT 


GGTTCAATGA 




AGTATGTAGC 


TAAATGAGCT TCTGTGTGGT 


1860 






TGCTTCTGTT 


ACATTTCGGC 


AATTTTCAAG AATTAGACGA 


1920 


CCAATCATAT 








GGTGCATAAA GTTATAGCCC 


1980 


ATAGTTAATC 


CTGA CT CATT 


CATACCATCC 


ATTCTTCCAG 


TTACCCTTGA TACAGGACCA 


2040 


ATTTGAGCTA 


AACCGCTATC 


TGTAGGTTGA 


TAAAGTAAGT 


AGCGACCATC ATAAGTTGCA 


2100 


GGGTGGTAAT 


CATAATTTCT 


AACCATGAAG 


TCTTTGCCTT 


GAAAGACCGT GCAaCCACTT 


2160 




CGGTAAAACG 


ATAATGTCCA 


AAGTTTAAAA 


TAATTTGGCG TG TTGGCATT 


2220 


TTGAGTATAC 




CATTAATTCT TCCCATATTT GAGGTG CGTA TGTTTGGAAT 


2280 


ATTTGATAAG 




ATCTATATCG 


AAACGTGGGA 


CaCnTTTTTT CCATTCTTTT 


2340 




TTAGAAGAGG 


TGTTTGTTGA 


AGCCATTTAC 


CAGTTTTAAC ACCTAACTCG 


2400 


AAATG TG AAC 


CTCTAAAAGT 


CATGATATCT 


GATGTCACTT 


GTTGCATATC ATCGGCCCCT 


2460 


TTC TTTTTAG 


TTGTAATATA 


TTGTAAATAA 


ATAGTAATCG 


TATGTATATT GAATGTCATG 


2520 


TTAAATAAAG 


TTATATTTTA 


CTAAATGAAA 


TATAAAATTG 


TTTGAGGTGA TTTCTCGGTG 


2580 


TATAAGACTT 


ATCAATCAGT 


TAAAACATAT 


TTTTATAGAT 


GGTGGGGATA TTGAGTTAAA 


2640 


AACTTAAAAT 


CATCTTATCA 


TAAATATCAA 


TCTTAAGTTA 


GCATTCACGA TAATAGTCAT 


2700 


TGTTAACATT 


AGCATATAAG 


GTCATGTCAC 


GTTGAAACAG 


AGGTTCCTCG GCATTTTTGA 


2760 
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TTATTTAATG ATTATTCTAT ATATGATAGT ATAATGAAAT GTAGATAGGT ATTTAATTTA 2 8 80 

ACAGAGGTGA AATTGAGATG TGGAATTTTA TTAAATGtGT GkTTAAATTC GTATTTAGCT 2 94 0 

TAGTTGCTAT TACAACATTA GTTGCTGGTG TTGGTGTAGT AGCATTTGCT TATATCTTTA 3000 

AAAAAGATTT TGAAGATATT GAAAGAAAAA CTAAAGAAAT TATTTCTGAT ATTGAAAGTA 3 0 60 

AAAATAACTA ATAACATTTA GAGGCTGGGA CATAAATCCC TAAAAAACAG CAGTAAGATA 3 12 0 

ATTTTCAATT AGAAAATATC TTACTGCTGT TCTCTATTTn ATcAraTACTt CGTATTGAAT 318 0 

GGCTTCGCTT TCCTAGGGTG CCGTCTCAGC CTTGGTCTTC GACTGGCACT GCTCCCTCAG 3 24 0 

GAGTCTCGCC ATTAATACTA CGTATTAACA TGTAATTTTA CTTTGGAAAT ACTTTTAAAA 3 3 00 

AATAAGACAC TTTGGCCCAA CTTGGCACAT AAATGTAAAA TTCAAT 3 34 6 
(2) INFORMATION FOR SEQ ID NO: 14 7: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2375 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14 7: 

GTTGAAGAAA GAAATATAAC AGTCAATTAT AATTATAAC C TTGTTGAAAT CGACGGTGAC 60 

AAAAAAGTGG CTACATTCGA ACATATCAAA GCATACGATA GAAAAACAAT AAGTTATGAT 12 0 

ATGTTACATG TAACACCACC TATGGGTCCC TTAGATGTAG TAAAAGAAAG TACACTTTCA 180 

GATAGTGAGG GTTGGGTAGA TGTTAACCCA ACCACATTAC AGCATAAAAG CTACTCTAAT 24 0 

GTATTTGCAC TTGGTGATGC TTCAAATGTA CCTACTTCAA AAACAGGCGC ACTATT cGTA 300 

AGCAAGCACC TATCGTCGCT AATAATTTAT TGCAAGTGAT GAATAATCAA ATGTTAACGC 360 

ATCATTATGA TGGTTATACT TCATGCCCTA TTG TTACTGG ATATAATAGG TTAATACTTG 42 0 

CAGAGTTTGA TTATAATAAA AATACTAAAG AAACAATGCC GTTTAATCAG GCCAAAGAAC 480 

GTaGAAGTAT GTATATATTT AAGAAAGATT TATTACCTAA AATGTAT TGG TACGGCATGC 54 0 

TAAAAGGATT AATATAATAA AGTACAGAAA ACAATAAATT TTTAATGAAA AATCTTTTAC 600 

TATAAAAGAT TAAGTATTTA AATGACGTGT CAGTGTTGTG TTTATATGTC GTGAATTTTT 66 0 

AGCTCTAAAT AGTATAAGAT TGAAAAAGTT GTTACTGTTT TAAATGATCA CGATGAAGTC 72 0 

ATTCAATAAG AATGATTATG AAAATAGAAA CAGCAGTAAG ATATTTTCTA ATTGAAAATC 7 80 

ATCTCACTGC TGTTTTTTAA AGGTTTATAC CTCATCCTCT AAATTATTTA AAAATAATTA 84 0 
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AGATATTCAA 


ACCACGTGTA 


CTCAAAATGA 


TAGCTTGGTA TGTACCTCCA 


ATAGTAATTT 


960 


CAATAACTTT 


GTCTGTTGAA 


CACTAAGAGC 


AATTTTAATT T CATAATGTG 


TTGTAAACAT 


1020 


TTTTTTTGAT 


TGGAGTTTTT 


TTCTGAGTTA 


AACGATATCC TGATGTATTT 


TTAATTTTGC 


1080 


ACCATTTCCA 


AAAGGATAAG 


TGACATAAGT 


AAAAAGGCAT CATCGGGAGT 


TATCCTATCA 


1140 


GGAAAACCAA 


GATAATACCT 


AAGTAGAAAG 


TGTTCAATCC GTGTTAAATT 


GGGAAATATC 


1200 


ATC CATAAAC 


TTTATTACTC 


ATACTATAAT 


TCAATTTTAA CGTCTTCGTC 


CATTTGGGCT 


1260 


TCAAATTCAT 


CGAGTAGTGC 


TCGTGCTTCT 


GCAATTGATT GTGTGTTCAT 


CAATTGATGT 


1320 


CGAAGTTCGC 


TAGCGCCTCT 


TATGCCACGC 


ACATAGATTT TAAAGAATCT 


ACGCAArCTC 


1380 


TTGAATTGTC 


GTATTTCATC 


TTTyTCATAT TTGTTAAACA ATGATArATG CAATCTCAAy 


1440 


ArATCTAATA 


GTTCyTTGCT 


TGTGTGTTCG 


CGTGGTTCTT TTTCAAAAGT 


GAATGGATTG 


1500 


TGGAAAATGC 


CTCTACCAAT 


CATGATGCCA 


TCAATAC CAT ATTTTTCTG C AAGTTCAAGT 


1560 


CCTGTTTTTC 


TATCGGGAAT 


ATCATCGTTA 


ATTGTTAACA ATGTGTTTGG 


TGCAATTTCG 


1620 


TCACGTAAAT 


TTTTAATAGC 


TTCGATTAAT 


TCCCAATGTG CATCTACTTT 


ACTCATGCGT 


1680 


TTGATAAAAA 


CTTAAATAAT 


ATTAATTCGG 


TCATCAGTGG CGTTAAATCT 


TTTATCATTT 


1740 


TTAGTTATAG 


TTGATAAATT 


TATATTTATA 


AGCATATATG GATATTTCAT 


CAAAAATTTT 


1800 


TATTTATATA 


AATCCGAACT 


GCATACATAT 


TTGTTTAAAT AAGAGGTATT 


ATTTTTCGGG 


I860 


AAATTGCTGT 


CTGAGTTAAA 


AGGATTAGTT 


TTATAAAATG AGTTGAACTA 


TAGCCAAAAA 


1920 


CGATTAAAAT 


ACTGATAATC 


CATTTTTGtA 


TTATGTTAGG GACTTTTTTA 


CTTAATTTTA 


1980 


ACCCTATTGG 


a GCmAATATA 


ATACTCCCTA 


TTATAAGGAA TAAGGCGTCA 


TATAAaGGGA 


2040 


TATAACCTTG 


AATAAGTTTG 


ATGACAAAAG 


CACCAATTGA AGATATAAAA 


GCAATTACTA 


2100 


TACfATTAGC 


GACTACAGTA 


TTCATTGGTA 


ATTTGAATAA AACCAATAAT 


ATAGGAATAA 


2160 


TAATGAAGGC 


ACCACCTGCA 


CC TACT AT AC 


CTGAAATAAT ACCAATGAAA AGGCCAATGA 


2220 


TAACTAATAA 


ATATTTATTA 


AATGAAGACT 


TTTCGGAACT AGGTTtCACT 


TTAATAAACA 


2280 


TTAATGTTAA 


TGCAAGTAAA 


GCAATAATGA 


TATATAC CGT ATTTA CAAAT 


GTAGCATCAA 


2340 


ATAAATTTGC 


TAG AAATG CA 


CCTAACATAC 


TCCCT 




2375 



(2) INFORMATION FOR SEQ ID NO: 14 8: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6115 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY : linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 148: 





GAGGTTTCTA GACAAGCTTT TAATAACTTA CCAAACTCAT TAAgrTGGTT gTGtTGGACT 


60 






G a GTTGTTTA 


ATATTAGtGC TAArACATAC 


GAAGAGTGGT 


120 




TTAAACAATT TAGTAGTAAG 


AAAGCACAAT 


TCAGTATTAA TCTCACGGAT 


AAATGGATAA 


180 


10 


TTCAAATCGC ATATGGTAAA 


TTAATAATAA 


TGGCTAAAAA TAATGGCGAT 


ACATATTTTA 


240 


GAGTTCAAAC AATTAAAAAG 


CCAGGTAATT 


ATATTTTTAA CAAATATCGA 


TTAGAGATAC 


300 




ATT CTAATTT ACCAAAATGT 


TTATTTCCGC 


TTACAGTGAG AACACGACAA 


AGTGGCGATA 


360 


15 


CATTTAAACT GAATGGGCGC 


GATGGTTATA 


AGAAAGTGAA TCGCCTGTTT 


ATAGATTGTA 


420 




AAGTGCCACA GTGGGTTCGG 


GATCAAATGC 


CAATCGTATT GGATAAACAA 


CAGCGCATTA 


480 




TTGCGGTAGG AGATTTATAT 


CAACAACAAA 


CAATAAAAAA ATGGATTATA 


ATTAGTAAAA 


540 


20 


ATGGAGATGA ATAGCGTTAT 


GCATAATGAT 


TTGAAAGAAG TATTGTTAAC 


TGAAGAAGAT 


600 




ATTCAAAATA TCTGTAAGGA 


ATTGGGAGCA 


CAATTAACAA AGGATTATCA 


AGGTAAACCA 


660 




TTAGTATGCG TGGGTATCTT 


AAAAGGCTCA 


GCAATGTTTA TGTCAGATTT 


AATTAAACGA 


720 


25 


ATTGATACCC ATTTATCAAT 


TGATTTCATG 


GATGTTTCTA GTTATCACGG 


AGGCACTGAG 


780 




TCAACTGGTG AAGTTCAAAT 


CATTAAAGAT 


TTAGGTTCTT CTATTGAAAA 


TAAAGACGTA 


840 




TTAATTATTG AAGATATCTT 


AGAGACTGGT 


ACTACACTTA AGTCAATTAC 


TGAATTATTA 


900 


30 


CAATCTAGAA AAGTTAATTC 


ATTAGAAATA 


GTTACTTTAT TAGATAAACC 


AAACCGTCGT 


960 




AAAGCGGACA TTGAAGCTAA 


GTATGTAGGT 


AAAAAAATAC CAGATGaATT 


TGTTGTTGGt 


1020 




TACGGTTTAG ATTATCGTGA 


ATTATAC CGA 


AACTTACCAT ATATCGGTAC 


GTTAAAACCT 


1080 


35 


GAAGTGTATT CAAATTAATT 


TTTTAATCAA 


TTTCAGTTAT TATTACTATG 


CGTTTGAGAA 


1140 




ATAATAGTGT AGACTCAAAA 


ATATGAAAAA 


TGTATTTCAT ATATATTTAA 


TTTTAGACAA 


1200 


40 


GACATATGTC TTGAAAAGTT 


GAAAAATATA 


GAGATTGATA AAACTAATAC 


GGGTGTGAAT 


1260 




GACATTGATG TTAAGCTCAA 


TT ACTAG CTT 


ATAAAACATG TCATATGTTA 


CAATTTTTGT 


1320 




TAGTTTTATT ATGGGAAGTA 


GGAGGAAATG 


ACGCATGCAG AAAGCTTTTC 


GCAATGTGCT 


1380 


45 


AGTTATCGTA ATAATAGGCG 


TTATTATTTT 


TGGTCTATTT TCATATTTAA 


ACGGTAATGG 


1440 




AAATATGCCG AAACAGCTTA 


CAT AT AAT CA 


ATTTACTGAG AAGTTGGAAA 


AAGGTGACCT 


1500 




TAAAACTTTA GAAATCCAAC 


CACAACAAAA 


TGTCTATATG GTAAGTGGTA 


AAACGAAAAA 


1560 




TGATGAAGAC TATTCATCAA 


CTATTTTATA 


TAACAACGAA AAAGAATTAC 


AAAAAATTAC 


1620 




TGATGCTGCT AAAAAGCAAA ACGG TGT AAA ATTAACGATT AAAGAAGAAG 


AAAAACAAAG 


1680 
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TTTCTTCCTA AGCCAAGCAC AAGGTGGCGG TAGTGGCGGT CGTATGATGA ACTTTGGTAA 18 0 0 

ATCTAAAGCA AAAATGTACG ATAATAATAA ACGTCGTGTT CGTTT CTCTG ATG TAGCAGG 186 0 

GGCAGATGAA GAAAAACAAG AATTAATTGA AATTGTTGAT TTCTTGAAAG ATAATAAAAA 192 0 

ATTCAAAGAA ATGGGATCTA GGATTCCTAA AGGTGTCTTA CTTGTTGGAC CTCCAGGTAC 19 8 0 

TGGTAAAACA TTACTTGCTA GAGCGGTTGC AGGTGAAGCT GGCGCACCAT TCTTCTCTAT 204 0 

TAGTGGTTCA GACTTTGTAG AGATGTTTGT TGGTGTTGGT GCGAGCCGTG TTCGTGACTT 2100 

ATT CGATAAT GCTAAGAAAA ACGCGCCTTG TATCATCTTT ATCGATGAGA TTGATG CTGT 216 0 

TGGTCGTCAA CGTGGTGCAG GTGTTGGTGG CGGTCATGAT GAACGTGAAC AAACCCTAAA 222 0 

CCAATTATTA GTTGAAATGG ATGGTTTCGG TGAAAATGAA GGTATCATTA TGATAGCTGC 22 8 0 

TACAAAC CGT CCTGATATCC TTGACCCAGC CTTATTACGT CCAGGTCGTT TTGATAGACA 234 0 

AATTCAAGTT GGTCGTCCAG ATGTGAAAGG CCGTGAAGCA ATTCTTCATG TTCATGCTAA 24 0 0 

AAACAAACCA CTTGATGAAA CGGTTGATTT AAAAGCAATT TCACAACGTA CACCTGGTTT 246 0 

CTCAGGTGCT GATTTAGAGA ACTTATTAAA TGAAGCATCT TTAATTGCTG TACGTGAAGG 252 0 

TAAAAAGAAA ATTGACATGA GAGATATCGA AGAGGCAACG GATAGAGTTA TAGCCGGACC 2 580 

TGCTAAGAAA TCTCGAGTTA TTTCTAAGAA AGAACGTAAT ATTGTTGCTC ATCACGAAGC 264 0 

TGGTCATACA ATTATC GGTA TGGTACTTGA TGAGGCAGAA GTAGTGCATA AAGTTACTAT 270 0 

TGTTCCACGT GGACAAGCAG GTGGTTATGC AATGATGCTA CCTAAACAAG ATCGTTTCTT 2 76 0 

AATGACTGAA CAAGAGTTAT TAGATAAAAT CTGTGGTTTA CTTGGTGGAC GTGTATCAGA 2 82 0 

AGATATTAAC TTTAACGAAG TATCAACAGG TGCTTCAAAT GACTTCGAAC GTGCAACACA 2880 

AATCGCACGC TCAATGGTTA CGCAATATGG TATGAGTAAA AAATTAGGAC CATTACAGTT 2 94 0 

CGGTCATAGC AATGGTCAAG TATTCTTAGG TAAAGATATG CAAGGTG AG C CTAATTATTC 3 000 

AAGCCAAATC GCATATGAAA TTGATAAAGA AGTTCAACGA ATCGTTAAAG AACAATACGA 3 06 0 

ACGTTGTAAA CAAATTTTAT TAGAGCACAA AGAACAATTA ATTTTAATTG CTGAAACATT 312 0 

ATTAACAGAA GAAACATTAG TTGCTGAACA AATTCAATCA TTATTCTACG AAGGTAAATT 3180 

ACCTGAAATT GATTATGATG CAGCTAAAGT TGTTAAAGAT G AAGATT CTG AATTTAATGA 3 24 0 

TGGTAAATTC GGTAAATCTT ATGAAGAGAT TCGTAAAGAG CAATTAGAAG ATGGACAACG 3 3 00 

TGACGAAAGT GAAGATCGTA AAGAAGAAAA AGATATTGCT GAGGATAAAA AAGAAGCTGA 3360 

TAAATCTGAT GAAAAAGATG AACCAGCACA TCGACAAG CC CCAAATATCG AAAAACCTTA 3420 

CGATCCAAAT CACCCAGACA ATAAATAATC GATTATATTC AGTACCT CTT TCTATGATAA 34 8 0 
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AATTGTTATA GCAGAAAATA ATTGTAAAAC AAGTTAC TTC ATTATTTAGA ATGATGGGTG 36 00 

TAGAATAAGT ACAATTGTTG CATTTTATGA AG TAAAGT AA TTTTTTAAAT ATAGAGTAAT 3660 

5 AGAGGAGATT GAAATAATGA CACACGATTA T ATTG TT AAA GCATTAGCAT TTGATGGAGA 3 72 0 

GATTAGGGCT TATGCTGCTT TGACAACTGA AACTGTTCAA GAAG CACAAA CGAGACATTA 3 78 0 

TACATGGCCG ACAGCATCTG CTGCAATGGG AAGAACAATG caCAGCAACA GCTATGATGG 3 84 0 

'° GCGCAATGTT GAAAGGTGAT CAAAAATTAA CTGTCACTGT AGATGGCCAA GGACCTATTG 3900 

GACGAATTAT TGCCGATGCA AATGCTAAAG GCGAGGTGCG TGCTTATGTA GACCATCCAC 3 96 0 

AAACTCATTT TCCATTAAAT GAGCAAGGTA AACTTGATGT AAGACGAGCG GTAGGGACAA 4 02 0 

is 

ATGGATCTAT TATGGTTGTT AAAGACGTTG GAATGAAAGA CTATTTCtCT GGAGCAAGTC 4080 

CaATTGTTTC AGGAGAACTT GGTGAAGATT TTACTTATTA TTATG CTACA AGTGAACAAA 414 0 

20 CACCTTCATC GGTAGGTCTT GGTGTATTGG TAAATCCTGA TAATACGATT AAAGCAGCAG 420 0 

GAGGATTTAT CATTCAAGTT ATGCCAGGTG CCAAAGATGA AACAATTTCA AAATTAGAAA 4260 

AAGCAATTAG TGAAATGACA CCAGTTTCTA AATTAATTGA ACAAGGATTA ACGCCAGAAG 4 320 

25 GATTACTAAA CGAAATCTTA GGTGAAGACC ATGTGCAAAT TTTAGAGAAA ATGCCTGTTC 4380 

AATTTGAATG TAATTGTAGT CATGAGAAAT TTTTAAATGC TATTAAAGGA TTGGG CGAGG 44 4 0 

CTGAGATTCA AAATATGATT AAAGAAGATC ATGGTGCTGA AGCAGTATGT CATTTCTGTG 4 500 

30 GAAATAAATA TAAATATACT GAAGAAGAAT TAAACGTGTT GCTAGAAAGT TTAGCGTAAT 4 560 

TTAATTTAAA TCAATACGCT AAAATGTTTA TTTTTAGCGG TTTAGTGAAA TGTAGAACTA 4 62 0 

AATAGTTGTA TAATCCTTAG TGATTTTGTT TGCTTTCTAG AATTTATTTG ATAAAATAAT 4 6 80 

35 

TCTATATCCG ATAAATAAAC TAAGATTTCA ACAACTAACT AAAAAGGAGT GTTCTTAATG 4 74 0 

GCAeAAAAAC CAGTAGATAA TATTACTCAA ATTATTGGCG GTACACCGGT AGTCAAATTG 4 8 00 

^ AGAAATGTAG TAGATGACAA TGCAGCAGAT GTTTATGTAA AATTGGAATA TCAAAATCCA 4 860 

GGTGGTTCTG TAAAGGATAG AATTGCTTTA GCAATGATTG AAAAAGCAGA GCGAGAAGGC 4 920 

AAAATTAAAC CTGGCGATAC AATTGTAGAA CCAACAAGTG GTAATACAGG TATCGGTTTA 4 980 

45 GCATTTGTAT GTGCTGCTAA AGGATATAAA GCAGTATTTA CTATGCCCGA AACAATGAGC 504 0 

CAAGAGCGTC GTAATTTATT AAAAGCATAC GGTGCGGAAT TAGTTTTAAC GCCTGGATCA 5100 

GAAGCGATGA AAGGTGCAAT TAAAAAAGCT AAAGAATTGA AAGAAGAACA TGGTTACTTC 516 0 

50 GAG CCACAAC AATTTGAAAA CCCTGCGAAC CCTGAAGTTC ATGAGTTAAC TACAGGTCCT 52 20 

GAG TT ATT AC AACAATTTGA AGGGAAAACT ATCGATGCGT TCCTAGCTGG TGTTGGTACT 52 80 
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GTTGCTATAG AGCCTGAGGC TTCTC CAGTA 


TTGAGCGGTG 


GTGAGCCAGG 


TCCACATAAA 


5400 




TTACAAGGTT TAGGTGCTGG ATTTATTCCA 


GGCACTTTGA 


ATACAGAAAT 


CTATGACAGT 


5460 




ATTATTAAAG TAGGAAATGA TACAG CGATG 


GAAATGTCTC 


GTCGAGTTGC 


TAAAGAGGAA 


5520 




GGTATTTTAG CAGGTATTTC ATCAGGTGCT 


GCGATTTATG 


CTGCCATTCA 


AAAAGCAAAA 


5580 




GAATTAGGAA AAGGTAAAAC AGTAGTAACA 


GTATTGCCGA 


GTAATGGTGA 


ACGCTACTTA 


5640 


10 


TCAACACCTT TATATTCATT CGATGACTAA 


TTAATGTCAT 


TTAAAAGAGT 


GAGTTATCTT 


5700 




TTTGAGATAA CTTGCTCTTT TTTTCTACCA 


TGTATATTTT 


TAAAAATATG 


AGCGTTAAAT 


5760 


15 


TAAACATTTT TCTGATAAAA ATATCCAGTG 


AATGATAAGA 


TAATAAACGT 


ACATACTAAT 


5820 




AACTAGTAAA TAG CAGGAGT AAATTTTATT 


AGAGTTAAAC 


AATACATAAT 


TAAAGGGTGG 


5880 




TTAACATGAC TAAAACAAAA ATTATGGGcA 


TATTAAACGT 


CACACCTGAT 


TcATTCTcAG 


5940 


20 


ATGGTGGAAA ATTTAATAAT GTTGAATCAG 


CTATAAATAG 


aGTGAAAGCC 


ATGATAGATG 


6000 




AAGGTGCTGA CATTATAGAT GTTGGAGGTG 


TTTCAACGAG 


ACCCGGTCAT 


GAAATGGTTT 


6060 




CATTAGAAGA TGAGATGAAC AGAGTATTAC 


CTGTTGTTGA 


AGCTATTGTC 




6115 




(2) INFORMATION FOR SEQ ID NO: 149: 










(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10401 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14 9: 






35 


TAGATACTGG GnTAAAcaTc AAAAATAtyT 


GCtTaTTCaC 


GTGTTTAcGc 


TCCCtCAAAC 


60 




GCAACGTTAA TTGCG TGTAA TCATTTAGTG 


TGAATTcAGA 


CGCTTCTTCC 


ATGACTATGT 


120 


40 


CTGATATGCC TTTTATCGAC TTTATTTTCT 


CTGGGTTATC 


TAATCCTTTA 


AACAAAAAAA 


180 




CTGCGCCGTT TGGCAATTCA ACTTTGTTAT 


CAGTCTTATT 


CCAAAGGCAC 


ATGTCCCAAA 


240 




TACCAAAGTT TATCAAACAA TCTTTAACAT 


CTTCGAACAA 


ACTATCTTTA 


ATTGTTGATT 


300 


45 


GTACTTTTCT AAGCCACAGT ATACGCCTAG 


GATATTTCCA ATCTTGCAAT 


GCTTTGAGTA 


360 




CAACTTTTTG TATAACGCCG TGAGACTTAC 


CGCTCGAACC 


TCCACCGTAA 


TGkACTTCAG 


420 




TGAAGTtATC GTAATTGGTT AGTATTTCGA 


ATATGTTTCT 


ATTGAAAACA 


TTAGACGGTT 


480 


50 


TGTTAAAGTT TAATT TAACT TTCGTCATCG 


TACTCACCAA 


TATTAATCTC 


AATATTCTTC 


540 




TGAGTAATTT CTTTTTTATC GATATACGCA 


CCATGTACTT 


TTAGTATGTG 


GTCAATAGAT 


600 



55 
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TCTTGAGGTT 


CTCCTCTAGC 


AATAGAAGCA 


720 




GATAACGCTA AAGCTTCTGT AATACTCATT 


AAACGCTCTT 


CTTGTATCTG 


TTCTAATCGT 


780 




TCTTTAATAT ATTCCGAAAC ATTAACATTT 


CTTAACAATC 


GACTTGCTAA 


AGACTCTGCT 


840 






GCTTTTTTAC 


CATTACATCC 


ATT CATT AT A 


900 




TATTP&TPTf: fTanTPTrTT p mY~ ,r r r rT"TTf"Y"' 


TTCATTTCAT 


TTACCACCAA 


CTCTCGCGCT 


960 


w 




CTATAATCAG 


CCAACCCACA 


TAGATCCTTT 


1020 




ATTCCTAATT GCGATAAGGG AAA CG CAGTA 


CGATAGTCAA 


TATCCTACAC 


TATCATAATA 


1080 


15 


TCTCATTTAA GGTATCAAAA ACTGCCACTT 


TACTGCCAAT 


TTCAGTCTTC 


CCCTAACTCT 


1140 




TCCGCCAATC TAGATATGAT TTTTCTTTTG 


ATTCTATGAG 


CAGTTCTATC 


AGAAATGTGT 


1200 




ATGTCAACAC AAACTTTCAC TAATTCCTTT 


TTATTAAAAT AATACTCTTG AATGAATTCG 


1260 


20 


CGTTCTTTCC TGCTTGATGT GTTGATTATA 


CGTTCAATAG 


CGCT CTTAAA 


CTCAAGGATT 


1320 




TTACCTCTTC GTATACTACA AAGATAATTA GTTACTGCCA TTTCTGTTTT 


CGATGTATTA 


1380 




GACGGTACAA ACTCCCCGCC TATATTTGTA 


TCTGTTGGAA 


TCCACGGTGT 




1440 




CTTCTTAAAT CTTCAAGTTG TTTATGATAA 


TTAGGATAAT 


CACACAACTC 


ATCTTCTAAC 


1500 




TTTCGAACTG TTGATAATTT TAATCCGTAT 


TTCTTTTTAG 


TCATGAATAC 


CCTCCGTACA 


1560 




AATATGTTTA ATCTTCAAAG TGTCTCAATC 


TACTTCTTAA 


TATCTCTATC 


TCTCGCTCTT 


1620 


30 


TAACTTTTAC ATCACCTTTT AACTGTTCCG 


CTTGTAACAT 


CACACCAAAC 


AATAAGATGA 


1680 




CTAGTAATAT AATTGCTATG ATTAACCACA 


TCATCTACTC 


CGACACCTCC 


GCCCTCATCA 


1740 




AATCAGACTG ATCACTCAAC TTTGCGAAGT 


CACTTGGCGC 


CTCTACATCA 


TCATTAGCCG 




35 


TCATCATAAT AT ATA CTTGC TCAGTTACAT 


ACTTACCTAA 


CTCATACATC 


GCTAGTAAGA 






ATAATAGTCT CAAAATTTCT TTAACCACCA 


CTAAACACCC 


CATGTTAATT 


TATC GATAAT 




40 


TTGTATAGCT TGTTTTAATG CGTCTCTTTT 


TTCTTTGATA 


TCTCTATTAT 


CGCCATCTTC 






ATCAGCTGAC ATTAACTCAC TGTCATATTC 


ATATAATAGT 


TCTGATATTT 


CATTACTAGC 






TACTACTAAT AAGTTTTCAT CTACATCAAT 


CGTTACCGTT 


TTCTTTGGCA 


TCTCCATCTC 




45 


TCCTTATCTT AACTTGTGCC TCGTATTTGC 


GCTCAGCTTC 


TTCTTTACTC 


TCTGCCTCAA 


2160 




CAACTGTAAA CGTCTGATTA TCTCTAGCAG 


TAGTAAAATG 


TTCATGTGGT 


TGTCCTGTTG 


2220 




AATCTTTGAA TGTTGTGACT AAGTATTGCG 


TCACTTCTTA 


TCACTCCTTT 


GAATGATTCT 


2280 




AAGTTTTTCT ACGAATAAAA GTATTAGTAC 


AACACTCAAT 


GTAGCCAACA 


TATTTTTTTG 


2340 




CTTTGCAAAA TCTACTATAA CGATTAAGAC 


TAATAACATT 


CCAATTCTGC 


ATGTAAATAA 


2400 
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TACAAGTATT GGAACTAATG TAATGATGTA ACTCACTTCC CCAAAACCTC CTTGACTCGA 2 520 

TCTAAGATGT CTTTACACTC CGCTACTTCC GAAGCCTTTT TCTCCACGTT CTGAAACACT 2 580 

5 TTCGAATTCC TCCACTTGCT TTAGTTCAGG TGTCCATATA GGCACGATAA CCAATTGAGC 264 0 

TAGTTTGTCT CCTTCGTTGA TTTGATAAGT TCCGTATTGT CTTATGGCGT CACTCAAATC 2700 

GATTTCTCCT TTAATATCAA AAACACCTGG TGTGATATAA CCATTCGATG CAATAGCGTC 2 760 

'° ATTCTTGATA TTAATCCCTA AATTGCCGTG ATATCCCGCG TCTATCTTGC CTGTTTCAAT 2 82 0 

CACTAAATGC GTTTTACTAC TTACACCACT ACGGCTAGTT AATAGTCCGA CATAGCCCTC 2880 

TGGTATGCTT ACAGCTACAT CTGTTTTAAT CACTGCCTTT TCTTGTGGCT CAAGTACGAC 2 94 0 

15 

AGTTT CAGCT GAGAATATGT CATAACCTGC ATCCGTCTTA TGATTTCGTT CGGGCATTCT 3 000 

AGCATTTTCT GATAATAGCC TTACTTGTAA TGTGTTAGTC ATTTTCCTGC TCCTCCCTAG 3 0 60 

CTGTAGCAAA CGCTATTCTC AATTTCAATC TTTCAACAAT ATGAATTAGT G CGGTATTGA 3120 

20 

GGAATATTTC AAATTCTTCA ATGTTCTCAT CTATAAAATC AAGTATTTCT TCCTCTTGTT 3180 

CACTGTCAAA CTCGCTTAGT ACATCCCAAA TATTTATGTC GCTTTTGCTC GTTTCTAATA 324 0 

25 CTCTTTTGAT TATTTCTGAA TTACTTTTAT TACTCATTTT CCTTGTTCCT CCTCATATTT 3 3 00 

ATAGACAACT TGACCTGCCA TAATCCCTAC TGCTTCATCA AGTT CAATAC CTTCTTTAAC 33 6 0 

TGAATGTTGA ATAG CATTTG TCATTCCCTC AAGTATTTCA TCAAAC GCTT GTGCTCTCTT 34 20 

30 ATACACGTCC TCAATCTCTT TTAGTAATCC CTCTGTGTCA TTACCGTTAT ACGCACTAGC 34 80 

ACTGATCACT GATTGTTCAA TTTGTTCGCG GTTATTCATC ATTTCCATCT CCTCTAAAAT 354 0 

AAAGTTAGTT GCTTCTGCTC CTCGTATTCC AAACCATGTT GCTTTATATA TGTTTCGAG C 3 6 00 

35 TCTTCCGCTG TATCAAATGT CTTTTTCACG CCTTGCCAAC CTGGCACGAT ATGCCCATGa 3 660 

AAGTAATAAG TGCCGTTCAC TACATGGATA TGTGCCACTC GTTCGTTATC CTGATACAGA 3720 

TATCTCTTAG ATCCGAAAAA TTGGTTTAAG TATTCTTTAC ATGCGCTATC GGTTTTAGGC 37 80 

40 

ATTTATGCTT CCTGCCATTT CTTAAACATT TGGTTATAAG TAGTATCAAA CCAGTACGGA 384 0 

TCACGTGAAT GTTTTTGAGG CACATTAAAC AAATGTGGCT TCTTCTTACG TAGTTCAGCC 3 90 0 

4s TCTTTACGTC GTTGCCTAGC CATTTCACGC TCTTTGCTCT CTCGCTCCAT GATTTT G GAT 3 960 

AACACAATTT CTTTATACTC AGCTAAGCGC ATACCATAAG GTGCATGTAA GGCTTCTAAC 4 020 

AACGCCCAGC CACCTCGTAC TCTTTTTGCA ACCATTCCTG GAGTTAAACC GTTCTTTTTT 40 8 0 

so ATCAATTCAT TTTCATGTTC GGTAAATTTA TATGGTTTAc CGTTAATCTT TACGATACTC 414 0 

ATTTATTCCA CCTCTATACA TTTACTTTTT TTAATCCAAT CCTCTAATTT GTGCGTGTTG 4200 
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ACATTTAAGT TAACCATCTC AGCTTTTCCG TTTTTATATC CACTAATAGT TGATCTTGAT 4320 

ACGCCAGTTT CATTGTGCAA ATCTTGGACA CTTACGTTAT CTCTAGCCAT GATTACCCTT 43 80 

5 AAATTAGTTG CGAATACTtC GTTCAACTTC ATTTATTCCA CCTCTATATA TGCATGTCTT 44 4 0 

ATTGTTATGT TGTCATACTT TAGTAATTCG TCCGGATTGT CATCTAAGCG CTTTGCCAGC 4 50 0 

GTATCTTTTT CTTTATCCAC ATCATCGTAA TGCTGATATT CAACTTCTGT AGGTATTCTT 456 0 

10 

ATATCAATCG TTGCGTTTAT ATATGCTTGT TGTTGCATTA GATCACTTCA TTTCTCTTTT 4 6 20 

TCTTTTACGT CTGACTTTCA CTAAGTCCTC ATATACCATC CATTCTTGAC CTGTGTATTT 46 8 0 

AGGCGCTTTA CAT AT CCA CG TTAAATTCAC ATCTCTATAC TGATATCTGA ATATCTTCGC 4 74 0 

15 

TTTGATGTTG GCAACTTCAG TCGCCTTACC TTTAACGTCT ATAACTTCAA CCAGTTTCCC 4 800 

TTCCTTCCAC AAAGAGAAAT CGG CTATATA CGTAATCGGT CTTTGTTTCC CGAATTTAGG 4 86 0 

2Q TTGTAATTCA AATTTCGGTT GTATTTCGAT ACGATCATAG TTAGTGCCAT TCATATTACT 4 92 0 

TTCTAAATAT TGGTAATATT CGCACTCTAC TTTG CTATCA AATACAATTC CTTTGTACTC 4 980 

AACTTTCTTA GCATTGTATT TACTCATTGT GCCACCTCTA AATATCAAAT ATCGTTGCTT 504 0 

25 GCAATCCTAG CTCTTGCTCA TATAGAAGCC CGTGAGCGCC TTTGAATCGT TTTAGGTCAC 5100 

TATCAGTCAT AATTTTCTTT TCGTCGCTGA AATGGGCTCC TGTGAGCGAA TAAACTTCAT 5160 

TTACGTTGTC TTTATACTTG ATGACCTTAA TATCTTCCGT GCCATCTTCT CGGTATAAGT 5220 

30 AATATTTTTC TTTCGGCATT TTTTAACACT CCTTAATGTG TGTTTTCTTC CAGTTGATTT 5280 

CATTCATGAT TTTCTTTTCA ACTCTGTCGT AATCATCGAA AGGCGATAAC TCGTTATTGT 5340 

CCAACAATCT ATTGACCGCC CAAC CAGTCT CGATATATAC ATTTGCTACA ATCGGGTCGC 54 0 0 

35 TTTGCTTTGT CTCTTCATAC ATCGATTTCA ATAAGCTTTT GAATTGCATT ATATTCATGT 54 6 0 

GAAAAACCTC TGAGTCTTCT TGTAATACTC AAATTCAATT ATTCCGGTTT CGCCGTCTTT 5520 

GTTTTTGGCT ATGTTACATT CAACAATAGA TTTGCCAGTG ATACTGTCAT CTTCGTCACG 5580 

40 

GTTATAATAA TCATCACGGT AAAGTAGCAT CGCTAAACTC GCATCTGCTT CTATTCCGCC 5640 

TGATTCTTTC ATGTCCGATA GCATTGGTCT TTTATCCTGT CTAGACTCGA CACCACGATT 5700 

45 CAGTTGTGAA AGTAGTACGA TGATTGCGCC TGTCTCGTTA GCGATTATCT TTAAGTCACG 5760 

TGATATCTTT TCTACTGCTA CACGTCTATC AACTTTCGCA TCAGTATCCA TCAGTTGAAG 5820 

ATAATCTATA AAAATAACTT GTTGCCTGTC TGAATGCCTC ATTGt TGCG C TCGCACATCT 58 80 

50 TGCGGTGTGA TATTACTTTT ATCAGAAATA TCGATGCCTA ATTTCATGAT TTTATCCATC 5940 

GCATTCGTTA ACTTTGTTAA GTCATCCGGC GTTAAGTTCC TGATTTCTTT TATCTTTGTT 6000 

55 
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AGACTAAAGA AAGAT GTTTT GTATCCATTT TGTGCTATGT TCAGCATCAT GTTTAATGCA 612 0 

AAAC CTGTCT TACCCACTGA GGGACGCGCT GCGATGACGA TTAATTGTGA TGGTTCTAAT 6180 

5 CCCCCTATTT TGTAATCCAT TAGCTTGTAA CCCGTCTTAA TTTGCTTCTT AGGGCTATCG 624 0 

CTGTATAACT CTTCGACAAA CTCCTCAACA AACTTCTTGG TTCCATCTTC TTTTTTGTTA 63 0 0 

GTAATTGTTT TTAAATCCTT GAGTTCATCA ATCAAGTTGT TAAAGTTTTG GTTCGTAGGT 636 0 

10 

TGTTGTTTGA ACTCAGTTAC CAATTCGTTA GCTTTGTTGA GCTGATAACT TTCCAATAAT 64 2 0 

TCTTGTTGAT AACGTTCAAA GAAGCCATAT CCAATGAAAT CGGAGTTGTA AAGTTTAGTT 64 8 0 

ATAGTATCTG CATCTAAAAA TTCTTTATCT TTAGTTGCTT TTAAATAGAT TTCTTGATGA 654 0 

15 

TCTATCTTTC CGACGTCCAT TACATAATTG AAAAAGGTTT TAAACTTTTC GTTCGTAAAC 660 0 

ATGTAATCTT TAACTC TT AT CTTTTCTAAT ACGTCCGGTT GTTTAAGTAG CGTAGCGATT 666 0 

2Q ATTGTACTTT CAATTTCGAA TTGTCCGTAA TTCATTCGTT TTCGCCCCCA AATTCTGCCA 6720 

ACTTATTCAT GAACTTATCT AGCGCTATTT TTCTTTGTCT GACATATTCG GGGTCATTCT 6780 

GCATTTTCCA TTGGTGTGTA GCGGTTTCGT TATCTACTGG CTCGATAGAT AC T T T TTTAG 684 0 

25 GTTCCTTACG CATGATTGCT GGTAAGTTAG GCGGGTACGG GTTGTTACTG TTGATATAAA 6 900 

CATCTACCGC TTTTACAGTT GGTTGATAAT CTCCATTTTG ACTTAATACA TCAATCCACA 6 960 

TTTCTAACTT CGGTTTATCA AAATCAATGT TGTATACGTA CCTAACTTTT TTAATAATTT 702 0 

30 CTAATGCTTG TGTTTTGCTC ATCGGCATTA GTCATCACTC AATTCTTTTT C CATTTGTGC 708 0 

AATGACATCA TCAGTAG TAT TTTTTCTAGG TGCTATTTTA TTTTCTGCAT CTTCTTTTGT 714 0 

TTTGACATTC TCTTTAGCCC AGTTGTTTAA AACTTTAATT AAATAGCCAC CAT GCGCACT 72 00 

35 

TTTGCTTTTA GTGTACTCAA CACCTACTTT TACAACTTCA AAAGCGTTTG TACCTATATC 726 0 

ATCAATAGCA AACCCTAATT GTTCCATTTG ATTAGGTGTT AACTT AT CAT CCAAATTTGC 73 20 

AATTATATAT TTTATTGAAG ATGAGAAGAC GGCTTCTCTT TCTTCTTCTT TATTCTTATA 73 80 

40 

TTCTTCTTCT TTTTCTTCTT CTCTTTCTTC TTCTTCTTCT GTAT CGTTAC GTAACGTTAC 74 4 0 

GGTAACGTTA CGTTTTGCTT CTAGTAACTT TTTCTGTTTC TCACGATAGC GTTGTTGTCG 75 00 

4S CAATTTATTT TTTTCTTTAT GCTTAGCTTT GCTATCTAAG CTTTGATGCT TCTCCCAGTT 75 60 

TGTCACTTTT ATGACACCAT TAACTTTTTC AATCATGCCC AATGTCTCAA AAGTTTGAAT 76 20 

TGCTAACCTT ATTGAGTTAA TAGGTCTATT AAATTCATTT GCTAACATTT CTTCGTTGTA 76 80 

50 CGGCAAGTTT TCGGATAGCA TAATATAACC TTGTTCATTG TACTTTCCTG ATAAAGTTAG 774 0 

TAACTTAACC CAAATAGTTA TGATCGTATC TCTTTCGGGT AAAGCTTCGA TATATTTGAT 78 00 
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CTCCTTTCAG CATTTTGTTG AGCCTCTCAT CAACTTTTAT CCACGAGTCA TGCAAGTGAT 7920 

ATTTATCATC AAACGACTTA ACGCCAATTG CGTGCTGTTC ATTATGATGT TGTCTACACA 7980 

GTGCTAACAC ATGTTTG TCG TAGTGATTCA TTTTGTTTCT GTTCATGCCT CTGC CGACTG 8040 

CTTCATAATG TGCCAGGTCT GCGTGAGGCT TTCCGCATAT TACACAGTTG CGGTTGATTG 8100 

TAGCCCAATA TAATAACGCT TTATCTTCGC TTAACAACTT ACTCGTTTCT ACACTCATAG 8160 

GTATTTGATG ATGAAACATA AACGCTATAA TCAGTTCTAT TAACTCCCTT G CAACTTT CA 8220 

TAGAACAGTC GCGCAGACTG ATTTCTTCAT AACCTTTCAT AATTTCCAAT TCTGTTTGTA 8280 

ATAATTTTCT AGTTGATTCT ACTGGTTCGC CCCAGTGAAG TTCTATATCT CTACACATT G 834 0 

CGAATATTTT TTTGCGTTGT TCTATAGATA GTTTTTTATT GTCCGGAACC TCTACTTCTG 84 00 

CTTTTAGTGG ATATCCGTTT TCTAGTAAGT CAATGTGACT TTGTTCAAGT TCAACACCAG 8460 

TAG CAACGAC GGAATAAGTA CCGTCATTGT CTTTCTGGTA TCTTGTAATG TATTGCATTT 8520 

AAACCACGTC CTAGAACGGT AAATCATCAT CATTGATTTC TATTGGACCA TTAGCATTAG 8580 

CGAATGGGTT TGATTGTTGA CTCATTGGCG TCTGTTTCCC ATTTGCTTGC TGTTCTTTTT 864 0 

GTTTCATCTC ATCAGTTTTA GGTTCTGGTT TATTAACTAC TTCATCGTCT TTATTCCAAA 8700 

CTTTTACATA TGAGAGTCTT ACAAAATACT TGCCTTGTTC CTCGTTAAAT TTATTTTTAA 8760 

GTACAATAGT TCCGATTTTG TTAATTAATT GATCTGTGTC AAAAGTTAAA TCTGGTAAGT 8 820 

TCAATTTAAT TCCTAATCTA CTAAGTAACT CGATATATTG TTTTTCTTGA TAATCTTGTT 8 880 

GGAATGGTGG GACGAATTGG TTGTGTTTGT ATTGTTTACC TTCGTTGTTT TCAAAAACAA 8940 

TCGTGAAGTA TCTGTTTTCT CTGTCGTTAA ACTCGACATT TGCAACTTTT ACTGTAAATT 90 00 

CTCCAGCTCC TAAAAAGTCC CCACCTTTCA TGAATGCCTC TTGATTAGTT TCTTGAATGT 906 0 

ATTGTGTTCT ACCAGTGATT TTCATAATTT TTATAC CGTC CTTTTAATTA ATTTTTAATT 912 0 

ACCATTTCTA ATTGCTTGTA CAACATCGTT AATACTTGGA TTAATGAAAC GTTTGTTG TT 9180 

AATTTTGATG TTGCTTGAGT GTCTTATCTT TGTCTCGAAT AAATTTGATG GTTCAGCGTT 924 0 

AAGTACATAT TGATAAGTTT TTTCGCCGTC TTGCTCATGT TCTT CTATTG TCATTCTTGC 93 0 0 

TAACACGTCA GATTGACTGA TGACTGCTTT TTTTATTTGG TCTTGTGCCT CTATCGTGAT 93 6 0 

TGTTGGATTG ATAGTACTTC CCTCATCATC TTTGTCTTTG TTAATGCCCT CGTGTCCGCT 94 20 

TATAGCAAGA TGAAATTGAT AATGTTCTTG TAATTTAGAA ATATAACGAT AAATACTTAC 94 80 

AATGCGTGTA GCACACTCGC CCCAATCATT AAATGTCGGT TTCTTTGATT TACCGTCCAT 954 0 

GATGTCGTCC ATAGTGATAT CACGTAACTT TTGGATTGTT TCAATCACTA CAACATCAAT 96 00 
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AAAATGCTTA TAATTCTTAA TCTGCACAAC TGCCCCATCT TCTGTTACCG TTGTTCCGTC 97 2 0 

CTCATTTATA TCTAGTACTA AGGCATTGTT ATCTTTTGTT AAAAACGTAG TTTTACCAGT 97 80 

5 ACCGAACTTG CCGTATATCG CAAATTTATA AAACTTGTTT GCATTTTGTT TGCTGATGTC 984 0 

TTTTACACCT AGTTGCGTTA AAATATCGAC ATCTTGATTA GTTTTTTCAG TCATCTATTC 990 0 

TCCCACCTTT ACCGTGTATG ACGTTGGTTT CTCCACAATG CTAGCACCCT CTAAAACTTC 9960 

10 

GCCGTTTGCG TCAAT CAATG TGCCGTTTTC AGTTACATTG AAATCTTTCT TAATGTCTGA 10020 

TTGGCTAAGT TTTTTAGTTA CTTTTACATA GTTGTCAAAA CCTCGTTGCT CAAGTTGTn T 10080 

AATGACTTCT TGCTCATTGC TAACTTGAAT GACTTTTGAA C CTTTT CTGG CTGTCACTTT 1014 0 

15 

TCCGTAAGtG TATT CAACTT GAATTTGCTA TCTTGTT CTT TTTGTATTCT GTAATATTCA 10200 

ATTACAAGGC TTTGTAAATA TTCTTTGCCA CTCTGTAATT TTTCTACTTC TTTATCTTTC 10260 

20 CATTCGTTTA TGCGTTCAAT TTCTTTATTT GCTAAATCGT TGATTTCATT CTCTTTAGTT 10320 

GTGATTGCAT CCAGTTTCTn AAAAACCCAG TTAGCACTGT CTAGATCAGT nACTTTGAAT 10380 

CGGTCGTCTT GTTCGAATGT n 10401 

25 (2) INFORMATION FOR SEQ ID NO: 150: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2989 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 (D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 150: 

35 

TTTCTCTCTA TTATTCTCGA TGCGTAGATA ATTGTTTAAA TTTAAGTTTA TAGTAATGTT 6 0 

GAGTTTATAA TTTCATATAT CTAAAAACAG GTGTTGTATA TATAATCATT CAT CTAGTTA 120 

TACTTACTTT AAAAATAATA TAATTTCATG CGATGCAATT CATTGATGGA TGTTTTTAAT 180 

40 

CTTAATCAAA TCCAaATAAA GCATATATTT TTAAATTCAC TTTCTTTCGA ATCGATTTTT 24 0 

ATCTCTTGnA TTAAACTTTT CCATTGTTTC ATTAAAGCTC TCTGTCATAT CTATTC CCAT 3 00 

4S TGAATTCGCT AAACATAACA ACACAAATAA ATTATCACCT AATTCTGCTT TAATCGTATT 3 60 

TGCTTCCTCT GAATCTTTCT TCTTTTTTTC ACCATAGGTA TGATTTATTT CACGTGCAAG 420 

TTCGCCCACT TCTTCAGTCA ATCTAGCTAA GTTAGCTAAT GGTGAAAAAT ATCCTGTTTT 4 80 

SO AAATTGTCCA ATATATTCAT CAACTT CACG TTGCATTTCT ACCATTGATT TCATTTCTAC 54 0 

GTTCTCCTTA TATTG CATTT CTAATATAGT ATATATCAAT TTGAAGTCTC ATGCATG TTT 60 0 

55 
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AATTCAGTTT ATATAAATGT AATGCATTCC TAACTAAATT AAATCAATTG AAATTGGGAT 72 0 

TATAACTTTA TGATACGTAC CACTACAATA AAATAATATA GTGAATAATC TACCATTAGA 780 

AAAATAAGCA CAAAAAAACT AG CAACCACA CAAAAATGTG ATTAG CTAGT TAATAAGTGT 84 0 

CTAATTTAAG TTAATTGTTA ATCTATAAGA TTAATCACTT GAACGCGCAA TCAAAATAAT 900 

ACGTACAAGC TCTGCTACAG CGACTGCAGT TGCTGCAACA TAAGTCATTG CTGCTGCAGA 96 0 

T AATACT TTA CGCGCATGCT TGTATTCTTT TTCATTTACA ATGTTCAATG CCGTAATTTG 102 0 

TTTCATCGCT CTTGAACTCG CATCAAACTC AACTGGTAAC GTAACAATTG AGAATAATAC 10 80 

CGCTAATGAC ATTAAACCAG CACCAATCCA TAAAGCAGTT GAACCaAATG CACTACCTAT 114 0 

CGCTGTTAAG ATAATACCTA ACATGATGAT CATATAACTT AATGAACTCC CTAGGTTTGC 1200 

AACAGGTACT AATGCTGCTC TGAATCTTAA GAACCAATAT CCTTGGTGAT CTTGAATGGC 126 0 

ATGACCAACT TCGTGGGCTG CAATTGCAGT TCCAGCAACT GATGGTCTGT CATAGTTTGC 1320 

AGGAGATAGT GAAACAACTT TCTTTTTAGG ATCGTAATGA TCTGTTAAGA ATCCTTCACC 1380 

TTTAACAACT TCGACATCAT AAATACCGTT TGCATGTAAA ATTTCTAATG CAACTTCACG 144 0 

ACCCGTTTTA CCACTAGTTG ATCTAACTTG TGAATATTTC TCATAGTTAG ATTTAACTTT 1500 

GTGTTGTGCC CATAAAGGAA GCACCATTAA TATTACGAAA TAAATTATCA TAGTAAAAAT 1560 

TGAAGACAAT AAACTCACTC TCCTTTATAA ATATTTTACT GTCATTTGCC GTTTTTATCA 1620 

AATCATTTAC ACTTTAATAA TTTGTTTAAT TCAATATAAA GCAAAAGTCC AAAAACACTT 16 80 

AGACAACATG ATAATACACC AATTTGCCAC ACATGTGTAG TTATAAAATC ATAATATGGA 1740 

AATTGAAGGT GAAAATAGTC AATATAATCA TTCAAAAACA CCCAAATCAT yGCTACACTG 18 00 

ATTCCAATCA TAGAACGTTT AAACCTAGGA TAGAAGTAAA TTGCCTGAAC AGCCATTATA 1860 

CTGTGGGAAA ACATTAATAC CAAACCATTT ACTGTAATAT CACCTTGTTC AATAATAAAT 1920 

AATATATTCA TTATAACTGC CCAAATCCCA TATTTGAATA ATGTTACAAA TGCCAGTGCA 1980 

TCGATAATAC TATTTTGTTT TTGAATTAAT ATCAATGAGA TAGAAATAAC TAAGTATAAT 2 04 0 

ATTGCAGTTG GGCTATCTGG AACAAAAATC TTAAAATGCC AGGGCGTATG ACTTAATTGT 210 0 

TCACCATACC ATATATAACC ATAAATCATC CCTAATATAT TACAAATGAG TAGCATCATT 2160 

AACCAAGAAC GTTGATAAAG TGTATATTGC CAAAATGCTT TAATTGTCAT CTGCTAAGTC 2220 

CTCAAATTGA TTATGTTTAT TTACTAGCTT GAGTGTATTT AAAATTTGCG TTAGTTGATA 2280 

AAAACGTTGC TTTTCATTCA TCTGTAAACT TAAATCAATA TTGTGTAACA AGTAATCTAT 234 0 

TAATAACGCA TGTTTATGCC GATCTATAGC CATACTATTT AAGTCATGAA GATAAGTTTG 24 00 
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TGACACGTTT GCGAAGTGAA TTTGAATATC AAAAGCACAG TTATGATTAG CGATATAATC 252 0 

AAATATTTCA TTTGTATTCA TTAACTTTAT ATTACGCTTA GTAAATTGAA TTGCAGAAGC 2580 

GTGACTTCCC ACTTCTGCAA TTTCTAATGT TTCATGATGA TTAATTTTTG TATCTACAAA 2 64 0 

ATGAATGTTT GCCAATTTCG CCTCATTCAC TTTTATATAG TTAAGCACCC AAACTGCAAT 27 0 0 

ACGCGACTTA AATCGATATT GAAAAAGTAA ATATTCAATA AAACTTTCTT TAATTTGATT 2 76 0 

GAGTGTCTCT GACATCAAAT ACCCCATTTT AAGATTGCAA TCTTGaTAAT TCGTCATGCC 28 2 0 

AATTTTCGTT ACTTGGcTCT AGTTCCAACA ATTGATTTAA AATAGTAATT GCTTGTTCCT 28 80 

TTTGACCAAT TTCAATTAAA TAGAAATAAT AATCACTCAT AAAATCAATA TTTGTTTTCA 294 0 

TCGTTGGATA TGCTAATTCA AAGAAATGTT GAGCTTCTTT ATCTCGCTC 298 9 
(2) INFORMATION FOR SEQ ID NO : 151: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1143 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 151: 

CATCAACTCC TTAATTACAC TGTAAATGAT ATGCGTCTTT TTGACAACTA TATTTGT CAA 60 

ATCTACACCA AAAAATATGA TTATCCACCT ATGTATGACA TTTTGAAACA AACACCTCAA 120 

CGCCTACAAG TCATAATTGT TTACTTTCGT TACACCTTCC TGCATAATTA ACAGCATTCT 180 

AATTTTAGTA TGATGCACGC ATTTTCACTA AATCAAACCA TTCAAAGGAG ACTATTATGG 24 0 

CATTTACATT ATCTGCAATT CAACAAGCAC ATCAACAATT TACTGGTGTT GACTTTCCAA 3 00 

AACTATTCAA AGCTTTTAAA GATATGGGGA TGACTTACAA TATCGTCAAC ATTCAAGATG 360 

GCACTGCAAC ATACGTACAT CAATCAGAAG ATGATAT CGT TACGTCATCT G T AAAAAG T A 420 

ATCATCCTGT TGCTCAAAAA TCAAACAAAA CAATAGTTCA AGACGTCTTA ACTAGACATC 4 80 

AACAAGGGCA AACAGATTTT GAAACATTTT GTGATGAAAT GGCTGAAGCT GGCATTTATA 54 0 

AATGGCATAT CGATATTCmA GCGGGCACTT GTACTTATAT CGACTTGCAA GACCAAGCTG 600 

TTATTTCAGA ATTAATCCCT CAATAAACTA TATTTATAGC AACATTTTAA TTATTTCATA 660 

AAATTTTATT GATAATCATT ATCGTTCGGT ATAAAGTAAA TACTATATAC TACTTATGAG 720 

TGAGGTTGAT TATCATGATA ACTAACACTT TTATTTTAGG CATCACAGGC CCAACAAGTC 780 

TTGTCG TCAT TAG CATTATC GCTTTAATTA TTTTTGGTCC GAAAAAATTA CCACAATTTG 84 0 
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AGTCTCACGA TACACCCAGT AAGGAATCGA AACAACAGCG AGAGCAATAG CACTGACCAC 960 

ACCTTACTGG TTCACTTTAG CGAACTACGC CATCGGTTAG TAAAAATTTT ATTGTCGTTC 1020 

GTCATTACGG TCATCGTCGT ATATGTyTCA TCATTTTGGT GGATGACACC ATTCATAACG 10 8 0 

TATATyACC C GgCACATGTG TcCTTACATG CATTTcATTC ACAGAAATGA TACAAATAAC 114 0 

GTG 114 3 



W 

(2) INFORMATION FOR SEQ ID NO : 152: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7953 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 152: 





CAACGCCTGA 


ACGTAAACCA 


TATCGTTTCG 


CGATTTCCTC 


ATCTTGA CTA 


TTTACTAAAA 


60 




ACTCTCTCAT 


GGCGATTAAT 


GTTTCTTTTT 


CTTCTTTAGT 


TAATGGTAAT 


TCTAACTCAG 


120 


25 


CTGCTTTTTG 


ACGCAAAGTT 


GGATGACCAT 


CTCTAATGAT 


GTCTTTCATT 


GTTAACATAT 


180 




ATTGCACCTT 


CCTTATTTTA 


ATTTGTTTTA 


GTTGAATGAC 


AGTAAAAAGG 


TTGTTAAGAT 


240 




ACTCATACAT 


TTTTATGTGT 


AAATAT CTAC 


AAAGTTAACC 


AACTACTGCC 


AATGTTTATT 


300 


30 


TTAGATAGTA 


TATGTAAATT 


TTCAaGAtAT 


GCgTAATTGC 


gTTAAAAAAT 


GaTTAAAGTG 


360 




TTGGTTTCAA 


GCAATGaTAC 


TTTAGAAATT 


TATTTATCAT 


CTTGACTTTA 


AAAATTATAT 


420 




TATAAATGAC 


GTAACTGTCA 


ACAGATATAC 


TTAGTArTGA 


AGATGTGTAA 


TGTAATTGTT 


480 


35 


TAAAATTGAT 


TTCCAAGCAG 


ATTTTATTTA 


TCATTTAATT 


TAAATAGCAA 


GTGGAGGTAC 


540 




AAGTAATGAA 


ATTTGGAAAA 


ACAATCGCAG 


TAGTATTAGC 


ATCTAGTGTC 


TTGCTTGCAG 


600 




GATGTACTAC 


GGATAAAAAA 


GAAATTAAGG 


CATATTTAAA 


GCAAGTGGAT 


AAAATTAAAG 


660 




ATGATGAAGA 


ACCAATTAAA 


ACTGTTGGTA 


AGAAAATTGC 


TGAATTAGAT 


GAGAAAAAGA 


720 




AAAAATTAAC 


TGAAGATGTC 


AATAGTAAAG 


ATACAGCAGT 


TCGCGGTAAA 


GCAGTAAAGG 


780 


45 


ATTTAATTAA 


AAATG CCGAT 


GATCGTCTAA 


AGGAATTTGA 


AAAAGAAGAA 


GACGCAATTA 


840 




AGAAGTCTGA 


ACAAGACTTT 


AAGAAAGCAA 


AAAGTCACGT 


TGATAACATT 


GATAATGATG 


900 




TTAAACGTAA 


AGAAGTAAAA 


CAATTAGATG 


ATGTATTAAA 


AGAAAAATAT 


AAGTTACACA 


960 


SO 


GTGATTACGC 


GAAAGCATaT 


AAAAAGGCTG 


TAAACTCAGA 


GAAAACATTA 


TTTAAATATT 


1020 




TAAATCAAAA 


TGACGCGACA 


CAACAAGGTG 


TTAACGAAAA 


ATCAwAAGCA 


ATAGAACAGA 


1080 
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AAGAAAAGCA AGACGTTGAT CAATTTAAAT AATTAATATA ATACAGATGG TAGGAAACAA 120 0 

CTAATACAGT TCCTATTATC TGTATCTTTT TTTATTAAAA CAGAACTTTT TCAAATGGTT 12 60 

5 TAACAGTCCC ATTTATTTGT GGTACAATTA GTAAGGATAA AATGAATTTC TATACAATTA 1320 

TGGGAAAGGT ATTGTGAATT GAATGGCTCC TAAGTTACAA GCCCAATTCG ATG CAGTAAA 13 80 

AGTTTTAAAT GATACTCAAT CGAAATTTGA AATGGTTCAA ATTTTGGATG AGAATGGTAA 144 0 

CGTCGTAAAT GAAGACTTAG TACCTGATCT TACGGATGAA CAATTAGTGG AATTAATGGA 15 00 

AAGAATGGTA TGGACTCGTA TCCTTGATCA ACGTTCTATC TCATTAAACA GACAAGGACG 156 0 

js TTTAGGTTTC TATGCACCAA CTGCTGGTCA AGAAGCATCA CAATTAGCGT CACAATACGC 16 2 0 

TTTAGAAAAA GAAGATTACA TTTTACCGGG ATACAGAGAT GTTCCTCAAA TTATTTGGCA 16 8 0 

TGGTTTACCA TTAACTGAAG CTTTCTTATT CTCAAGAGGT CACTTCAAAG GAAATCAATT 174 0 

20 CCCTGAAGGC GTTAATGCAT TAAGCCCACA AATTATTATC GGTGCACAAT ACATTCAAGC 18 00 

TGCTGGTGTT GCATTTGCAC TTAAAAAACG TGGTAAAAAT GCAGTTGCAA TCACTTACAC 18 60 

TGGTGACGGT GGTTCTTCAC AAGGTGATTT CTACGAaGGT ATTAACTTTG CAGCAGCTTA 192 0 

25 TAAAGCACCT GCAATTTTCG TTATTCAAAA CAATAACTAT GCAATTTCAA CACCAAGAAG 1980 

CAAGCAAACT GCTGCTGAAA CATTAGCTCA AAAAGCAATT GCTGTAGGTA TTCCTGGTAT 204 0 

CCAAGTTGAT GGTAT GGATG CGTTAgcTGT nATATCAAGC AACTAAAGAA GCACGTGACC 2100 

30 GCGCAgTTGC AGGTGAAGGT CCAACATTAA TTGAAACTAT GACATATCGT TATGGTCCTC 2160 

ATACAATGGC TGGTGACGAT CCAACTCGTT ACAGAACTTC AGACGAAGAT GCTGAATGGG 2220 

AGAAAAAAGA CCCATTAGTA CGTTTCCGTA AATTCCTTGA AAACAAAGGT TTATGGAATG 22 80 

35 

AAGACAAAGA AAATGAAGTT ATTGAACGTG CAAAAGCTGA TATTAAAGCA GCAATTAAAG 234 0 

AGGCTGATAA CACTGAAAAA CAAACTGTTA CTTCTCTAAT GGAAATTATG TATGAAGATA 24 00 

TGCCTCAAAA CTTAGCAGAA CAATATGAAA TTTACAAAGA GAAGGAGTCG AAGTAAGCCA 2460 

TGGCACAAAT GACAATGGTT CAAGCGATTA ATGATGC GCT TAAAACTGAA CTTAAAAATG 252 0 

ACCAAGATGT TTTAATTTTT GGT GAAGACG TTGGTGTTAA CGGCGGTGTT TTCCGTGTTA 2 58 0 

45 CTGAAGGACT ACAAAAAGAA TTTGGTGAAG ATAGAGTATT CGATACACCT TTAG CTGAAT 2 64 0 

CAGGTATTGG TGGTTTAGCG ATGGGTCTTG CAGTTGAAGG ATTCCGTCCG GTTATGGAAG 270 0 

TACAATTCTT AGGTTTCGTA TTC GAAGTAT TTGATGCGAT TGCTGGACAA ATTGCACGTA 276 0 

50 CTCGTTTCCG TTCAGGCGGT ACTAAAACTG CACCTGTAAC AATTCGTAG C CCATTTGGTG 2820 

GTGGCGTACA CACACCAGAA TTACACGCAG ATAACTTAGA AGGTATTTTA GCTCAATCTC 288 0 
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CTATTAGAAG TAATGACCCA GTCGTATACT TAGAGCATAT GAAATTGTAT CGTTCATTCC 3 00 0 

GTGAAGAAGT ACCTGAAGAA GAATATACAA TTGACATTGG TAAGGCTAAT GTGAAAAAAG 3060 

AAGGTAATGA CATTTCAATC ATCACATACG GTGCAATGGT TCAAGAATCA ATGAAAGCTG 312 0 

CAGAAGAACT TGAAAAAGAT GGTTATTCTG TTGAAGTAAT TGACTTACGT ACTGTTCAAC 3180 

CAATCGATGT TGACACAATT GTAGCTTCAG TTGAAAAAAC TGGTCGTGCA GTTGTAGTTC 3 24 0 

AAGAAGCACA ACGTCAAGCT GGTGTTGGTG CAGCAGTTGT AGCTGAATTA AGTGAACGTG 33 00 

CAATCCTTTC ATTAGAAGCA CCTATTGGAA GAGTTGCAGC AGCAGATACA ATTTATCCAT 33 6 0 

TCACTCAAGC TGAAAATGTT TGGTTACCAA ACAAAAATGA CATCATCGAA AAAGCAAAAG 342 0 

AAACTTTAGA ATTTTAATAC ATTTTAAAAG TTAACGAAGT TAGCGTATTT TAGTCTCATT 34 80 

GATTAAAATG AAATGTTTAA TTTACGAAAT CTTAGGAGGG CAAAAACGTG GCATTTGAAT 3 54 0 

TTAGATTACC CGATATCGGG GAAGGTATCC ACGAAGGTGA AATTGTAAAA TGGTTTGTTA 3 6 00 

AAGCTGGAGA TACT ATT GAA GAAGACGATG TTTTAGCTGA GGTACAAAAC GATAAATCAG 3660 

TAGTAGAAAT CCCATCACCA GCATCTGGTA CTGTAGAAGA AGTTATGGTA GAAGAAGGTA 3 720 

CAGTAGCTGT AGTTGGTGAC GTTATTGTTA AAATCGATGC ACCTGATGCA GAAGATATGC 3 7 80 

AATTTAAAGG TCATGATGAT GATTCATCAT CTAAAGAAGA ACCTGCGAAA GAGGAAGCGC 3 84 0 

CAgcAGaGCA AGCACCTGTA GCTACTCAAA CTGAAGAAGT AGATGAAAAC AGAACTGTTA 3 90 0 

AAGCAATGCC TTCAGTACGT AAATACGCAC GTGAAAAAGG TGTTAACATT AAAGCAGTTT 3 960 

CTGGATCTGG TAAAAATGGT CGTATTACAA AAGAAGATGT AGATGCATAC TTAAATGGTG 4 020 

GTGCACCAAC AG CTTCAAAT GAATCAGCTG CTTCAGCTAC AAGTGAAGAA GTTGCTGAAA 4 080 

CTCCTGCAGC ACCTGCAGCA GTAACATTAG AAGGCGACTT CCCAGAAACA ACTGAAAAAA 414 0 

TCCCTGCTAT GCGTAGAGCA ATTGCGAAAG CAATGGTTAA CTCTAAGCAT ACTGCACCTC 4200 

ATGTAACATT AATGGATGAA ATTGATGTTC AAGCATTATG GGATCACCGT AAGAAATTTA 4 260 

AAGAAATCGC AGCTGAACAA GGTACTAAGT TAACATTCTT ACCTTATGTT GTTAAAGCAC 43 2 0 

TTGTTTCTGC ATTGAAAAAA TACCCAGCAC TTAACACTTC ATTCAATGAA GAAGCTGGTG 43 8 0 

AAATCGTTCA TAAACATTAC TGGAATATCG GTATTGCAGC AGACACTGAT AGAGGATTAT 44 4 0 

TAGTACCTGT TGTTAAACAT GCTGATCGTA AGTCTATTTT CCAAATTTCA GATGAAATTA 4 500 

ATGAATTAGC TGTTAAAGCA CGTGATGGTA AATTAACAGC CGATGAAATG AAAGGTGCTA 4 560 

CATGCACAAT CAGTAATATC GGTTCAGCTG GTGGACAATG GTTCACTCCA GTTATCAATC 4 62 0 

ACCCAGAAGT AGCAATCTTA GGAATTGGCC GTATTGCTCA AAAACCTATC GTTAAAGATG 4 6 80 
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ATGGTGCAAC TGGCCAAAAT GCAATGAATC ACATTAAACG TTTATTAAAT AATCCAGAAT 4800 

TATTATTAAT GGAGGGGTAA AACATGGTAG TTGGAGATTT CCCAATTGAA ACAGATACTA 4860 

5 TAGTAATCGG AGCAGGTCCT GGTGGATACG TTGCAGCAAT TCGTGCAGCT CAATTAGGAC 4 92 0 

AAAAAGTAAC AATC GTTGAG AAAGGTAATC TTGGTGGTGT TTGCTTAAAC GTAGGATGTA 4 98 0 

TTCCTTCAAA AG CATTACTA CATGCTTCTC ACCGTTTTGT TGAAGCACAA CATTCTGAAA 504 0 

W 

ACTTAGGTGT TATTGCTGAA AGTGTTTCTT TAAACTTCCA AAAAGTTCAA GAATTCAAAT 510 0 

CATCAGTTGT TAATAAATTA ACTGGTGGTG TTGAAAGCTT ACTTAAAGGT AACAAAGTTA 516 0 

ts ACATCGTTAA AGGTGAAGCA TATTTCGTAG ATAACAATAG CTTACGTGTT ATGGACGAAA 52 2 0 

AGAGCGCACA AACATACAAC TTTAAAAATG CAATCATTGC AACAGGTTCA AGAC CAATTG 528 0 

AAATTCCTAA TTTCAAATTC GGTAAACGTG TTATCGACTC AACAGGTGCT TTAAACTTAC 534 0 

20 AAGAAGTACC aGGTAAATTA GTTGTAGTTG GTGGAGGATA CATTGGATCA GAATTAGGTA 54 0 0 

CAGCATTTGC TAACTTTGGT TCAGAAGTAA CCATCCTTGA AGG TGCTAAA GATATCTTAG 546 0 

GTGGCTTCGA AAAACAAATG ACACAACCTG TTAAAAAAGG TATGAAAGAA AAAGGTGTTG 552 0 

25 AAATCGTTAC TGAAGCTATG GCTAAATCAG CTGAAGAAAC AGATAACGGA GTTAAAGTTA 558 0 

CTTATGAAGC TAAAGGCGAA GAGAAAACAA TCGAAGCTGA TTATGTATTA GTAACTGTAG 564 0 

GTCGTCGTCC AAACACAGAC GAATTAGGCC TAGAAGAATT AGGTGTTAAA TTCGCTGACC 570 0 

30 

GTGGATTATT AGAAGTTGAT AAACAAAGCC GTAC GTCTAT CAG CAATATC TATG CAATTG 57 6 0 

GTGATATCGT TCCAGGTTTA CCACTTGCTC ACAAAGCTAG CTATGAAGCT AAAGTTGCTG 582 0 

CTGAAGCAAT TGATGGTCAA GCTGCTGAAG TTGATTACAT TGGTATGCCA GCAGTATGCT 5880 

35 

TTACTGAACC AGAATTAGCT ACAGTTGGTT ATTCAGAAGC GCAAGCTAAA GAAGAAGGTT 594 0 

TAGCAATTAA AGCTTCTAAA TTCCCATATG CAGCAAATGG TCGTGCATTA TCATTAGATG 6000 

4g ATACTAACGG ATTTGTTAAA CTTATTACAC TTAAAGAAGA TGATACTTTA ATCGGTGCTC 606 0 

AAGTAGTTGG TACTGGTGCA TCAGATATTA T CTCTG AATT AGGTTTAG CA ATTGAAGCTG 6120 

GTATGAATGC TGAAGATATC GCATTAACAA TCCATGCACA TCCAACATTA GGTGAGATGA 6180 

45 CTATGGAAGC AGCAGAAAAA GCTAT CGGAT ACCCAATCCA TACAATGTAA TAACTGATTA 624 0 

TCTATAAAGA TTCAGTCATT AAAAGCTGTA GCATATGCTA CGGCTTTTTT GTTTTAGGTA 630 0 

AAGTAATGTA AGGAAATTGA TTTGAGATAT CGTTAACATG TGACATGCAT GTTATACTAG 636 0 

50 CGATGCTAAT AAAAGAATTG AAATGGAGGG TTCAACAATG GAATATGAGT ATCCAATTGA 6420 

TTTAGACTGG AGTAAT GAAG AGATGATTTC AGTGATAAAT TTCTTTAATC ATG TAGAGAA 64 80 

55 



773 



EP 0 786 519 A2 



AATTGTGCCT 


GCTAAAGCAG 


AGGAAAAACA 


AATTTTTAAT 


ACTTTCGAAA AAAGTAGTGG 


6600 


CTATAATAGT TACAAAGCAG TTCAAGATGT AAAAACTCAC TCTGAAGAAC AAAGAGTAAC 


6660 




TAATTCGTTC 


GAAATTAACA 


CAATTTAATA 


GGAATTTTTC 


TTTAAAACTA 


6720 


TTGCTAATAA 


AGCTATATTT 


TGATACCTTT 


ATCAAGTGTT 


AAACAAAATG 


TTTGATAAAA 


6780 


GTAAACTTAA 


TATAGCTTTT 


TTAGGTGGAA 


AAATAAATGA 


ACATAGGTAA 


TAAAATTAAA 


6840 


AATCTTAGAA 


GAATTAAAAA 


TTTAACGCAA 


GAAGAACTTG 


CTGAACGTAC 


AGACTTATCG 


6900 


AAAGGCTACA 


TTTCACAAAT 


AGAAAGTGAA 


CATGCCTCAC 


CAAGTATGGA 


AACTTTCTTA 


6960 


AATATTATAG 


AGGTGTTAGG 


AACGACGCCA 


AGTGAATTTT 


TTAAAGACAG 


TGAAAATGAA 


7020 


AAAGTATTAT 


ACAAGAAGGA 


AGAACAAGTT 


ATTTATGATG 


AGTATGATGA 


AGGTTATATA 


7080 


TTAAATTGGT 


TAGTTTCAAA 


GTCAAATGAA 


TATGATATGG 


AG CCATTAAT 


ATTAACTTTA 


7140 


AAGCCTGGAG 


CATCATATAA 


AAATTTTAAT 


CCATCAGAGT 


CTGATACGTT 


TATTTATTGT 


7200 


ATGTCAGGTC 


AGATAACACT 


TAATTTAGGC 


AAAGAGATAT 


ATCAAGCACA 


AGAAGAAGAC 


7260 


GTTTTGTATT 


TTAAAGCACG 


AGATAATCAT 


CGTTTGTCAA 


ACGAATCAAA 


CAATGAAACA 


7320 


CGAATACTTA 


TTGTAGCGAC 


AGCTTCATAT 


TTATAGGGGG 


GATCTTATTT 


GGAACCGTTA 


7380 


TTAT CATTAA AATCAGTTAG 


TAAAAGCTAT 


GATGATCTTA 


ATAT CTTAGA 


TGACATAGAT 


7440 


ATTGATATTG 


AATCAGGATA 


CTTTTATACA 


TTATTAGGTC 


CTTCAGGTTG 


TGGTAAAACA 


7500 


ACAATTTTAA 


AATTAATTGC 


AGGGTTTGAA 


TATCCTGACA 


GTGGTGAAGT 


GATTTATCAA 


7560 


AACAAACCAA 


TTGGTAATTT 


ACCACCAAAT 


AAACGTAAAG 


TGAATACAGT 


CTTTCAAGAT 


7620 


TATGCATTAT 


TTCCACACTT 


AAACGTCTAT 


GATAATATCG 


CTTTTGGTTT 


GAAATTAAAA 


7680 


AAATTATCAA 


AAACCGAAAT 


TGATCAAAAA 


GTAACTGAGG 


CATTAAAATT 


AGTAAAACTT 


7740 


TCAGGTTATG 


AAAAAAGAAA 


TATTAATGAA 


ATGAGTGGCG 


GACAAAAGCA 


ACGTGTTGCA 


7800 


ATTGCACGTG 


CTATCGTAAA 


TGAACCAGAA 


ATATTATTGT 


TAGATGAATC 


TTTATCCGCA 


7860 


TTAGATTTGA 


AATTGCGTAC 


TGAAATGCAA 


TATGAATTAC 


GAGAATTGCa 


AT CTAGATT A 


7920 


GGtATTACAT 


TTATATTTGT 


aACACATGAT 


CCA 






7953 


(2) INFORMATION FOR SEQ ID NO: 153: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2347 base pairs 

(B ) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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GGCGTGATCA TACGACCGTC ATTCATGCTC ATGAAAAAAT AT CT AAAGAT TTAAAAGAAG 6 0 

ATCCTATTTT TAAACAAGAA GTAGAGAATC TTGAAAAAGA AATAAGAAAT GTATAAGTAG 120 

5 GAAACTTTGG GAAATGTAAT CTGTTATATA ACAGCACTAA TGATnACAAT CATTTTTTAC 180 

ATTTCTATAT GCTAATGTGG CAAGATGAGC AAAACTCATT TTGTGGATaA TGTTTaAAAG 24 0 

TCATACACAC CATACACAAG TT AT CAACAT GTGTATAAyT cGcCAAATCT ATGTTTTTAA 3 00 

GACTTATCCA CCAATCCACA GCACCTACTA CTATTACTAA GAACTTAAAA CCTATATAAT 3 60 

TATATATAAA CGACTGGAAG GAGTTTTAAT TAATGATGGA ATTcACTATT AAAAGAGATT 420 

ATTTTATTAC ACAATTaAAT GACACATTAA AAGCTATTTC ACCAAGaACA ACATTACCTA 4 80 

15 

TATTAACTGG TATCAAAATC GATGCGAAAG AACATGAAGT TATATTaACT GGTTCAGACT 54 0 

CTGAAATTTC AATAGAAATC ACTATTCCTA AAACTGTAGA TGGCGAAGAT ATTGTCAATA 6 00 

20 TTTCAGAAAC AGGCTCAGTA GTACTTCCTG GACGATTCTT TGTTGATATT ATAAAAAAAT 660 

TACCTGGTAA AGATGTTAAA TTATCTACAA ATGAACAATT CCAGACATTA ATTACATCAG 720 

GTCATTCTGA ATTTAATTTA AGTGGCTTAG ATCCAGATCA ATATCCTTTA TTACCTCAAG 7 80 

25 TTTCTAGAGA TGACGCAATT CAATTGTCGG TAAAAGTGCT TAAAAACGTG ATTGCACAAA 84 0 

CAAATTTTGC AGTGTCCAcC TCAGAAACAC GCCCAGTACT AACTGGTGTG AACTGGCTTA 900 

TACAAGAAAA TGAATTAATA TGCACAGCGA CTGACTCACA CCGCTTGGCT GTAAGAAAGT 960 

30 TGCAGTTAGA AGATGTTTCT GAAAACAAAA ATGTCATCAT TCCAGGTAAG GCTTTAGCTG 1020 

AATTAAATAA AATTATGTCT GACAATGAAG AAGACATTGA TATCTTCTTT GCTTCAAACC 10 80 

AAGTTTTATT TAAAGTTGGA AATGTGAACT TTATTTCTCG ATTATTAGAA GGACATTATC 114 0 

35 

CTGATACAAC ACGTTTATTC CCTGAAAACT ATGAAATTAA ATTAAGTATA GACAATGGGG 12 00 

AGTTTTATCA TGCGATTGAT CGTGCCTCTT TATTAGCGCG TGAAGGTGGT AATAACGTTA 1260 

TTAAATTAAG TACAGGTGAT GACGTTGTTG AATTGTCTTC TACATCACCA GAAATTGGTA 13 20 

40 

CTGTAAAAGA AGAAGTTGAT GCAAACGATG TTGAAGGTGG TAGCCTGAAA ATTTCATTCA 13 80 

ACTCTAAATA TATGATGGAT GCTTTAAAAG CAATCGATAA TGATGAGGTT GAAGTTGAAT 144 0 

45 TCTTCGGTAC AATGAAACCA TTTATTCTAA AACCAAAAGG TGACGACTCG GTAACG CAAT 1500 

TAATTTTACC AATCAGAACT TACTAAAAAT AAATATAAAT AAAGGATGAC GTGATTAATT 1560 

AAAACGTCAT CCTTTATTTT TTGGCAAAAA TAATTCTAGG TGCGTATGTA AAATAAATTT 1620 

50 GGCAGCATTT TAAACAGCAA ATAAAAGACG CCAATTAAAT TTATGACAAA TGTATC CAAA 1680 

ATTTAATAAG TGTG CTTATA TGCCCTTTAA ATTTAAAATT TTAATAGTCA ATAACAAGTT 174 0 
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AAAAATAAGA ATTAATTATT TATATGTAAA CGGTTTCTAC CTC TATTTT A AATGAAATTT 18 60 

GTGACAAAAA AAGGTATAAT ATATTAATGA CATACAAAGA AATGGAGTGA TTATTTTGGT 192 0 

TCAAGAAGTT GTAGTAGAAG GAGACATTAA TTTAGGTCAA TTTCTAAAAA CAGAAGGGAT 1980 

TATTGAATCT GGTGGTCAAG CAAAATGGTT CTTGCAAGAC G TTGAAGTAT TAATTAATGG 204 0 

AGTGCGTGAA ACACGTCGCG GTAAAAAGTT AGAACATCAA GATCGTATAG ATATCCCAGA 2100 

ATTACCTGAA GATGCTGGTT CTTTCTTAAT CATTCATCAA GGTGAACAAT GAAGTTAAAT 2160 

ACACTCCAAT TAGAAAATTA TCGTAACTAT GATGAGGTTA CGTTGAAATG TCATCCTGAC 22 2 0 

GTGAATATCC TCATTGGAGA AAATGCACAA GGGAAAGACA AATTTACTTG GAATCAATTT 22 80 

ATACCTTAGC TTTAGCAAAA AGTCATAGAA CGAGTAATGG ATAAGGGACT CCATACCGTT 23 4 0 

TTAATGC 234 7 
(2) INFORMATION FOR SEQ ID NO: 154: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 13542 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 154: 

ACAAGACGTn TCTATAACTT ATCTGAAATC GCTCGTCAAG ATAAAGATTA TGCAACTATC 60 

TCATTCTTAA ACTGGTTCTT AGATGAACAA GT CGAAGAAG AATCAATGTT TGAAACTCAC 12 0 

ATCAATTATT TAACTCGTAT CGGCGATGAC AGCAATGCAT TATATCTTTA CGAAAAAGAA 180 

CTTGGCGCTC GTACATTCGA CGAAGAATAA TTAAACATCA CTACAATAGA CAGATAAATA 240 

TCATACGACA TGATAGGCAT TTGGGTCACT TACAATAACC CAATGTCTAT ATTATTTTGC 3 00 

TTTACGGAGA TCACTAGATT CATTTTCTGA AT CATTGATC TGCGTTTTTT CATTTTCAAG 36 0 

GCTAATTATT GTATTTTTAG TCATTTATTT TTTAAACTAC TAATGTTAAT AACTCTAAAT 4 20 

TTGATGTTGA ATTAATTTGA CGATTTTAAA GCATATCATC ATTTACTTTT TAATCAGAGT 4 80 

TACATCCAAA TGATAGATTT CACGTTATAC CTTCACGTAT AATATTATGT ATCGTTTGTA 54 0 

AGCAAATGAC TAAAAGTCTA TTAATATATA CATTTAATTA ATTGAAAGGA TTGACTACAT 6 00 

GATACAAGAT GCGTTTGTTG CACTTGATTT TGAAACAGCA AATGGTAAAC GTACAAGTAT 660 

TTGTTCTGTC GGAATGGTTA AAGTCATTGA TAGTCAAATA ACAGAAACAT TTCATACTCT 720 

TGTGAATCCG CAAGACTATT TTTCACAACA AAATATTAAA ATTCATGGCA TACAACCAGA 780 
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aGATTTACCT GTTGTCGCAC ATAACGCGGC ATTTGATATG AACGTCTTAC AT CAAAG CAT 900 
TCAAAATATT GGTTTAC CAA CTCCAAATTT AACTTACTTT TGTAGTTATC AACTTGCTAA 960 

AAGAACCGTT GATTCGTATC GATACGGTTT AAAACATATG ATGGAGTTTT ATCAATTAGA 102 0 

TTTTCATGGT CATCATGATG CATTGAATGA TGCCAAAGCA TGCGCAATGA TTACTTTTAG 1080 

GCTACTGAAA AATTATGAAA ATTTAACATA TGTAACTAAT ATTTATGGTA AAAATCTAAA 114 0 

AGATAAAGGC TAGGACTAAA TAAAATACTC CCTTCAAAAG TAAGCATTGT AAAAATGTAA 1200 

ACTTTGCAGG GAGCTTTATT TTATATAAAG TCATATATCG TCATATTTTT ATAAGTTGAT 1260 

TGTTCTAAAT TACCTACAGT GACAC CAATA AGTCGAATTG GTACATCAGG GTCTTTTAAA 1320 

TCGTTATAAA GTAAATATGC AATATTATAA ATATCTTCTT CAGAACTAAC CGAATCTCTT 13 80 

AAACTCATCT GTTTAGATAG CGTTTCAAAT TGATAAGTTT TAATTTTAAC CGTTACAGTT 144 0 

TTAGCTGACT TCTGTAATTT ATTTAGACGT TCAGCTGTTT TACCTGnACA ATTCCCATAC 15 0 0 

TTTTCTTAAA ATCTCTTCAT CATCATTCAC GTCTGTTGCA AATGTGCGTT CAGTCCCTAC 15 6 0 

TGATTTTCTT ACTCTTGATG ATTTCACTTC ACTATGGTCA ATACCGCGTG CCTTGTTATA 1620 

TAAACCCCGA CCTCTTTTTC CAAACAAACG TATTAATTCA AATTCCGTTT TCTCATATAA 16 80 

ATCTCTACCG TTAAAAATAC CATTATCATG CATTACTTTT TTGGAAGCTT TACCTACGCC 174 0 

TGGaAAATCT CCAATATCCA ATGTCATCAA AATATCATGG aCATTTTGAT AATCAATCAC 180 0 

AGTCATACCA TCAGGTTTAT TCATACCACT CGCTAATTTA GCTAAAAATT TGTTATAAGA 186 0 

AACACCTGCA GATGCTGTTA AATGTGTCTG CTCTAGAATA TCTTTTCTAA TATACTGAGC 1920 

AATTTTCGAA GCAGGAAGGT CTGGTCTCAC TAATTCTGTA ATAT CTAAAT ACGCTTCATC 1980 

CAATGACATC GGTTCTACCT TATCTGTATA ACTTCGGAAA ATAGACATAA TCTGCGCAGA 204 0 

TGTTTCTCGG TAAGCACCAA AATTACTTGT GACAAAGTAT CCATTTGGAC ATAATTTATG 2100 

CGCTTGTGAC ATAGGCATTG CTGAATGGAC GCCGTATTTT CGTGCTTCAT AGGATGCCGT 2160 

AGAGACAACA CCCCTACTGC TTGCTTTACC ACCAACAATG ACTGGTTTCC CTTTCAATTT 2220 

GGGGTTATCT CTCATTTCGA CTTGTGCAAA AAAATAGTCC ATATCTATAT GAATAATTCG 22 80 

TCTCTCAGTC AAGTG CTCAC CTCCCTACTA ATTTTTACTT TTATAACG CA CAAAAATATC 234 0 

TCAACATAAT TATACGCTGT GTACGATTTT TTTACATAAA TCTTGCACTT AG CGAT AACT 24 00 

ATATTGaGAT AACTACAAGT TGTTATaAAA TCAATTGCTA TTTAAGCATG ATGATGAAGA 24 60 

CGATTGAGTA AGAAAACATA GGTAATCTGA AATAATT CAA GCAAATTCAT TTTGTTGGTA 2 520 

TCATCATATT AAAATTTATT ATTGAGTCGG CTTTTGATGA TACAAATAAA TACTATCTTC 25 80 
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AAAGCAATAA GCGGTATGCA TACTAAACAT AAAAATAAGT GATGAATAAC CAAATACCTT 2 7 00 

AATTAAAATA AGCAAGCCAG TACTTAATAG GATTAGTGGT GACAGCATAA TAATTGAGAA 2 76 0 

TTGCCATTTG TTGAAGCAAG CATCTGCTGT TTGGAATAAG ATTCTGTCTT TTTTTATATT 2 82 0 

AAACATAGGT TTGCTATCTT TTTTAAATAA AAGAAATAAT GCTCTATGGA TAAGTTCATG 2 880 

TAAAATCAAT AAAATAATGA ATCCAGCAAA CCCATATACA AGATTGATGA TGATATTTTG 2 94 0 

ATCGACAACC GCTGTGACAC CTAACGCCCA CTTATACGTA AATAAAATCA CGAATAACGC 3 000 

AATAACAAGT TGCAAGATAA TAAACCTTCG CATTTGAAAA TTATTTGTCG TTAAATCAAT 3 060 

TTTATGCATT ACCAACCCTC CCGATCATGA CATTCTTATT CTTCTTTAAA TATAGTATAC 3120 

AATGTCACAT TTAATTTAAA AAGTTCATAT CAAGAAAGTA AATTGGCTGT AATAAAATTT 3180 

TAATATACGA CTTCTTTCTT CACTTATTAA GGCGAAATTT TATCtCAAAT CATGTGCGCT 3 24 0 

ATTTCAAATT GAATAATGCC ACTGTCTCAA CATGTGTTGT TTGTGGAAAC ATATCTACCG 3 300 

GTGTTACCTC TTCAAGTTGA TATTTTTCAG CTAATAATAA TGCATCACGT TGCTGTGTTG 3 3 60 

CGGGATTACA TGAAATATAG ACAATACGCT TAGGTTCTAA TGTAAGCAAA GTCTGAATAA 3 4 20 

ACGTTTCGTC ACAGCCCTTT CTTGGCGGAT CAACCATTAC AACATCTGGT TTAATCCCTT 34 80 

GTGCTTTCCA TTGTAAAATA ACTTCTTCAG CTTTCCCACA GACAAAAGTT GTATTATTGC 3 54 0 

ATTGGTTTAT AGTCGCATTT TGTTGTGCGT CTTCAATTGC AGAAGGTACT ACTTCAACAC 3 6 00 

CGTATACATG TTTTGCAAGT GGTGCCATAT ATAGCCCTAT TGTTCCAATA CCACAATAGG 3 660 

TATCTAATAC AACTTCATTA CCTGTCAATT GCGCATACTC AATTGCTTTA TTATATAATT 3 72 0 

TCTCTGTTTG TTCAGAATTA ATTTGGTAGA ATGACTGATC ACTTATTTTA AATGTACTAT 37 8 0 

CTGTTAATTG ATCAATAATT GTAT CTTTAC CATATAGCGT TATAGATTGA CGTCCCATAA 3 84 0 

TAACATTAGA GTGGCTATCA TTAATGTTTT GTTTAATGCT TGTCACATTA GGAAATGCAT 3 900 

CTAATATCTT CTCAACAACA GCATTTTTTT GTGGCCACTT TTTACCATTA GTTACAAAAA 3 960 

TAATCAT CAT TTCGTCTGTA TGATATCCTG TTCTTACAAC CAAATGTCTC ATTAAACCTT 4 02 0 

TTTTCAATTG TTCTTGATAA ATACTTACAT TTAAATCTTT TAAAATAGAT TTAACTTCAT 4080 

TCATCACTTC TTGATGTTGT GAATCTTGTA TTAAACAACT TTCCATGTCA ATAATGTCAT 4140 

GGCTTCTTTG ACGATAAAAG CCCATAATAA CTTCATTCTG TTCATTCTTA CCAACTGGAA 4 200 

TCTGGGACTT GTTTCGATAT CTCCAAGGAT CTGTCATGCC AACTGTATCG TTAATCTTAG 4 2 60 

AATTATCAAA ATG CGCTTTT CGCTGAAACA AATTAATCAC TTGTTCCTTT TTCATTTCAA 4 3 20 

GTTGTGCTTC GTATGATAAG TGTTGAAGTT GGCACCCACC ACAACGTTCA TAATATATAC 4 3 80 
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AGTTC1TTTT TACTTTGATA ATTTTATATT CAATTTGTTC ATTAATTAAA GCTTGTGGTA 4 50 0 

TGAAAATAGG AAAGCGATCT ATTTTTACGA CACCATGGCC TTCATGCGTT AAATCAACAA 4560 

5 CTGTTCCCGT TTTTATGTCA TTTTTAGCTA TTGCTTGCAA AATTTTACCT CCAAAATGAA 462 0 

CAGGTTAGGA ACAAAATTAT GCGCTTCCTA ACCTGCCATT ATATATTTCA CTATTTCTGT 4680 

TTATTCTTCG ATTAAATTGT CATCAACATG AT CATTATTT ATTAACTCTT CATTTACAAT 4 74 0 

W 

ATCATTAGGT GCAAAGACAT CTATATGACG TTCTAGATTT AAGAAATTCG CTGGTAATTT 48 00 

ACCACCATAT TCTCCATCTA CATTTAGTTG TAAGTCTGTG AATGATGAAA TATTAATTGC 486 0 

CTTTGCTTTT TCATAAATAA CTTTAGGATG CTTAGTATGT TCTCCTCTTG AAGCTAAAGT 4 920 

15 

CATAATATGA CCAAGTTCTG CAAGGTTTGA TTTTTCAACT ATAATTAACG TAAAATAGCC 4 98 0 

GTCATCTAAC TTAGCGTCCG GCACTAATTT TTCAAATCCT GCCATTGAAT TTGTTAAACC 504 0 

2Q TAAAAAGAAT AATAATGCTT CTCCTTGGAA AACATTACCA TCATATTCAA TTCTTAAATC 510 0 

TACAGCTTTC ATTTGAGGTA ACATTTCGAA ACCTTTGaTG TAATAAGCAA ATGGACCAAC 5160 

AATAGATTTC AATTTACTCG GTGTTTCATA AGAGACTTGC GTCAATTGTC CGCCTGCAGC 5220 

25 TAAATTAATA AAGTATCGAT TATTCATTTT ACCAATATCT ACTTTAGTAG AATGACCTTC 52 80 

AATGATGACA TCAAGTGCCC CCATGATGTC ATTAGGTATA TGCAATGCAC GTCCAAAGTC 53 4 0 

ATTAACAGTA CCCATAGGAA TGACACCTAG CTTAGGACGA TTAGGCTTTT CTGCGATACC 54 0 0 

30 ATTAACTACT TCATTTAATG TTCCATCACC ACCTGCAGCG ATTAATACAT CATAATTTTC 54 6 0 

ATGCATAGCT CTTTCTGCTT CAAGTGTGGC ATCACCTATT TTCTCGGTTG CATATGCACT 552 0 

CGTTTCATAT CCCGCTTTTT CTAATTTTAT TAAGGCATCA GGTAATTCTC TTTTAAATAG 558 0 

35 

CTCTTTACCT GATGTCGGGT TATAAATGAT TCTAGCACGT TTCCTCATAT CTTATCCCTC 564 0 

TACTTAAAAT TCATATATTT TAACTTCATC TTTGTTTCGT CTAATAGGGA GTGGGACAGA 5700 

AATAATATTT AACAAAATTT ATTTCGTTCT ACCCCAACTT GCATTGTCTG TAGAATTTCC 5760 

40 

TTTCGAAATT CTCTATGTTG GGGCCCCACC CCAACTTGCA CATTATTGtA AGcTGACAGA 5 820 

AAGTCAGCTT CTTTGTTTGG GGGCCCCGCC AACTTGCACA TTATTGTAAG CTGACAGAAA 58 80 

4S ATCAGCTTCT ATGTTGGGGC CCCACTAGAA TTGAAAAAAG CTTGTTACAA GCGTATTTTC 594 0 

TTTCAGTCAA CTACAGCCAA TATAACATTG TAGTGCCTAG GACATTGAAT TTATGACCCA 6 0 00 

GGCTCAGTCT TATTTCAT CA TTCTTAATAT CGTTAAAGAC CAACTTGTAT CTTAAACAAA 606 0 

SO TACTATCTCA ATATGTACAA AGCTTGTTAT TTATTCAGCA TTTTTTGCCG TTCTTCATTA 612 0 

TAtAGcTTCG TCAGTTATGC TATTTTACCT TTAAAATGAT GTTGTAAATA TAATGTTGTC 6180 
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AACGCATTAA TAAAATTAAT ATTTTTACCA TTAACATGTA CAATGAATAA AGTTAAAAGT 6 3 00 

AATTTGACTT CTATAG ATAT AAATAAACCC TCGATTGCAT CTAAGTCAGC AATCAAGGGT 6 3 60 

TTATTTTTTA AATCTTCATA GTTTGATGAT TTAAATT AT C TTTTATCTAA TTCTTGTTTT 64 2 0 

AATAGTTGAT TTACTAATTG TGGATTAGCT TGACCTTTAG ACGCTTTCAT AATTTGACCA 64 80 

ACTAAGAAGC CCATAGCTTT GCCTTTACCA TTTTTGTAAT CTTCAACTGA TTGTTCGTTA 654 0 

TTGTCTAATG CTTCATTTAC AAATTTTAGA AGTGTTGCTT CAT CAGAAAT TTGAACTAAG 66 00 

CCATTATCTT CCATAATCTG TTTAGCATTA CCACCTTTAG CTGCTAACTC TGGGAAGACT 66 6 0 

TTCTTCGCAA TTTTACTGCT CATTGTTCCG TCTTCGATAA GTTTAATCAT ACCTGCTAAA 672 0 

TTTTCTGGTG TTAATTTAGT ATCTAATAAT TCTACTTGAT TTTTATTTAA ATATTCGTTT 678 0 

ACGCCACCCA TTAACCAGTT AGATGTTAAT TTAACATCTG CACCGTGTTC AATTGTTGAT 6 840 

TCAAAGAAAT CTGACATTTC TTTAGTCAAT GTTAATACGT GTGCATCGTA TGCAGGTAAA 6 900 

CCT AATT CAT TTACATACTT AGCTTTACGT TCATCTGGTA ATTCAGGAAT TGTCTGACGA 6 960 

ACACGCTCTT TCCAAGCATC ATCAATATAT AAAGGTACAA TGTCAGGCTC TGGGAAGTAA 7020 

CGGTAATCAT CAGAACCTTC TTTAACACGC ATTAAAATTG TTTTAC CTGT AGATTCATCA 70 8 0 

AATCGACGTG TTTCTTGTCC GATTTCTCCA CCATTTAACA ATTCTTCTTC TTGG CGTTTT 714 0 

TCTTCATATT CTAAACCTTT ACGTACATAG TTAAATGAGT TTAAGTTTTT CAATTCGGCT 7 200 

TTAGTACCAA ATTTTTCTTG ACCATATGGA CGTAAAGAGA TGTTAGCATC ACAACGTAAA 726 0 

GATCCCTCTT CCATCTTAAC GTCTGATACA CCAGTGTATT GAATAATTGA ACGCAATTTT 7 3 20 

TCTAAATATG CATATGCTTC TTTAGGTGAA CGAATATCTG GTTCAGATAC GATTTCAATT 73 80 

AGCGGTGTAC CTTGACGGTT CAAGTCAACT AATGAATACT CACCTTTATG TGTTGACTTA 744 0 

CCAGCATCTT CTTCCATGTG AAGACGAGTA ATACCGATTC GTTTTGTTTC ACCGTCGACT 7 500 

TCGATATCGA TATATCCATT TTCAC CAATT GGTTGATCAA ATTGAGAAAT TTGATATGCT 7 56 0 

TTTGGATTAT CTGGATAGAA ATAGTTCTTA CGGTCAAACT TAGATTCTGT TGCX3ATTTCC 7 620 

ATATTTAGTG CCATTGCAGC ACGCATTGCC CAGTCTACTG CACG CTTATT AACAACTGGT 7 680 

AAGACAC CTG GATATGCTAA GTCGATAACA TTTGTATTTG AGTTAGGTTC TGCTCCAAAA 7 74 0 

TGCGCTGGTG ATGGAGAAAA CATTTTTGAG TCCGTTTTTA ACTCTACGTG AACTTCAAGT 7 800 

CCTATAACTG TTTCAAAATG CATGATTTCC ACTCCTTATA ATTTTTCATA AACGTCATGT 7 860 

AAATTGTATT GTGTTTCATA TTGATAAGCG ACACGATATA ACGTTTTTTC ATCGAATGGT 7 920 

TTACCAATGA ACTGTAAACC GATTGGTCGG C CATTTGATT GTCCACAAGG AA CAGAAAT A 7 9 80 
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GGATCATCAA TTTCTTCACC TAAATTAAAC GCaGTgTnAG GCGCTGTTGG ACCAACTACT 8100 

ACATCATAAT TTT CGAATAC TTTATCAAAG TCATTTTTAA TCAATGTTCT AACTTTTTGA 8160 

GATTTTTTAT AGTAAGCATC ATAGTAACCT GAACTTAATG CAAATGTACC TAAGAAAATA 822 0 

CGACGTTTTA CTTCTTTACC GAAACCTTCA GATCTTGACA TTTTATATAA TTCTTCTAAT 82 8 0 

GAATGAGCTT CTTTAGAATG ATAAC CATAA CGAATTCCGT CAAAACGAGA AAGGTTTGAC 8 34 0 

GAAGCTTCTG ATGATGCAAT CACGTAATAT GATGGAATAC CAAATTTAGT ATTTGGCAAT 84 0 0 

GATACTTCCT CAACGACAGC ACCTAAAGAT TTTAAAGTTT CTACAGCGTT TTGAACTGCT 84 60 

TCTTTTACGT CATCAGCTAC ACCTTCACCT AAGTATTCTT TAGGTAATGC AACTTTTAAT 8S20 

CCTTTAATAT CTTTACCAAT TTCAGATGTA AAGTCTACAT CATCAACTGG TGCACTTGTA 858 0 

GAGTCATTAA CATCTGCACC AGAAATAGCT TCTAATACGA TTGCATTATC TTTTACATTT 864 0 

CGAGTCAATG GACCAATTTG GTCTAATGAA GATGCAAAAG CAACTAATCC AAATCGAGAT 870 0 

ACACGACCGT ATGTTGGTTT CATACCGACA ACGCCACAAT ATGCAGCCGG TTGTCTAATT 876 0 

GAACCACCTG TGTCTGAACC TAAGCTAAAT GGTACTAAGC CAGCTGCAAc TGCTGCTGCA 8 82 0 

GATCCACCTG ATGAACCACC TGGCACTGCT TTATGGTCAA ATGGGTTAAC TGTTTTTTTG 8880 

AAATAAGATG TTTCTGTTGA ACCACCCATT GCAAACTCAT CCATATTTAA TTTACCGATT 8 94 0 

AAAACGGCAT TTT CATTATG TAGTTTTTC C ATTACAGTAG ATTCGTAAAT TGGCACAAAA 9 000 

CCTTCTAACA TTTTACTTGC ACATGTTGTT TCTAATCCGT TTGTAATAAT GTTATCTTTT 9060 

ATACCCATTG GAATACCAAA TAATTTGCCA TCCATTTGAT CTTTTG CTTG TAATTCATCC 9120 

AATTCTTGCG CTTTTTTGAT TGCATTTTCT TTATCCAGCG CTAGAAAAGA CTTAATTGTT 918 0 

GGATCAGTCT CTTCAATTGC ATCATATATA TCTTTAACAA CATCAGATGG TTTGATTTTT 924 0 

TTGTCTTTTA TTAAAGTTAA TAAATTCTCA ACCGATTCGT AGCGAATGCT CATCTTACGC 93 00 

GTCCTCCTCA TTCATGATTG TAGGCACTTT AAATTGTCCA TCTTCTGTTT CTTTGGCATT 936 0 

TTTCAAAGCT AATT CTTGTG GAATACCTTT AATTGCTTTA TCTTCACGTA AAACGTTTTG 942 0 

TAAATCTAAA ACGTGATATG TAGGTTCAAC GCCTTCTGTA TCAGCGCTAT CATTTTGTTT 94 80 

TGCAAAATCT AAAATGCTTT CTAATGTGTT GGCCATTTCT TCCGTTTCTT CAGGAGAAAT 954 0 

TTGAAGTCTT GCAAGATTCG CGATATGCTC AACTTCTTCA CGTGTTACTT TTGTCATTAA 960 0 

TAAAAGCCTC CTTTAAGTCA TTCATCACTA AATTGTATCA AATTTC CAAT TAAAAATCTA 966 0 

AGTATTTATG AGGTGCTACT TTAATTTCAT ATAAACTGTA TAAACATTAT CATT CGTTTA 9720 

TCAAATCATT TTTTATGAAA ACAACACTCT TTTAATATTA GACAAC CCAA TTCAATATTA 978 0 
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TATATTGGTA TGCAAGTATT TCAAAAAGAA TAAATTTAAT TTTCCTACTT TTCTAAACAT 9900 

TTATCTTTAT GTATAATGTT TTCAAGTAAC TAAATTATAA ATTAAATAAA GGGAGTGTTT 9 96 0 

ATCATGCTTA CAATGGGGAC AGCATTAAGT CAACAAGTAG ATGCCAATTG GCAAACTTAT 1002 0 

ATTATGATTG CCGTCTACTT CTTGATACTA ATCGTTATTG GCTTTTACGG TTACAAGCAA 10080 

GCAACTGGTA ACCTAAGCGA GTACATGTTA GGTGGACGTA tATTGGACCG TATATTACTG 1014 0 

CATTATCAGC TGGAGCTTCA GATATGAGTG GATGGATGAT TATGGGGCTA CCTGGTTCTG 10200 

TCTATAGCAC TGGTCTATCA GCTATGTGGA TTACAATCGG TTTAACATTA GGTGCTTATA 1026 0 

TAAATTACTT TGTTGTTGCT CCTAGACTTC GTGTTTATAC CGAATTAGCT GGAGATGCAA 10320 

TTACATTACC AGATTTCTTT AAAAATCGTT TAAACGATAA AAATAATGTG TTAAAGATTA 10380 

TTTCTGGATT GATTATCGTA GTATT CTTTA CATTATATAC ACATTCTGGT TTCGTATCTG 10440 

GTGGTAAACT ATTTGAAAGT GCTTTTGGAT TAGATTATCA TTTCGGTTTA ATATTAGTTG 10500 

CTTTCATTGT CATTTTCTAT ACTTTCTTTG GTGGATATTT AGCTGTATCA ATTACAGATT 10560 

TCTTCCAAGG TGTCATTATG TTAATTGCGA TGGTTATGGT CCCTATTGTT GCTATGATGA 10620 

ATTTAAACGG CTGGGGAACG TTTCATGATG TAGCAGCTAT GAAACCTACA AATTTAAATT 10680 

TATTTAAAGG GTTAT CATTT ATAGGAATTA T CTCTCTATT TTCATGGGGA TTAGGTTATT 10740 

TCGGTCAACC TCATATCATT GTAAGGTTTA TGTCTATTAA ATCACACAAG ATGCTACCTA 10800 

AAGCTAGACG TTTAGGTATT AGCTGGATGG CTGTTGGTTT ATTAGGCGCT GTGGCTGTTG 10860 

GTTTAACAGG TATTGCATTC GTACCTGCTT AT CAT ATT AA ACTAGAAGAT CCTGAGACAT 10920 

TATTCATCGT GATGAGTCAA GTACTCTTCC ATCCTCTTGT AGGTGGTTTC TTACTTGCTG 10980 

CGATTCTAGC TGCAATTATG AGCACGATTT CTTCACAATT ACTTGTAACA TCTAGTTCAC 11040 

TAACGGAAGA CTTTTATAAA TTAATTCGTG GTGAAGAAAA AGCTAAAACG CACCAAAAAG 11100 

AATTTGTTAT GATTGGAAGA TTATCTGTAT TAGTTGTAGC AATTGTTGCC ATCGCGATTG 1116 0 

CATGGAATCC AAACGACACA ATTCTAAACT TAGTAGGTAA CGCTTGGGCC GGATTTGGTG 11220 

CATCGTTCAG TCCACTTGTG CTATTTG CAC TTTACTGGAA AGGTTTGACA CGTGCCGGTG 11280 

CTGTAAGTGG AATGGTTTCA GGTGCCTTAG TCGTTATCGT TTGGATTGCA TGGATTAAAC 11340 

CATTGGCACA TATCAACGAA ATATTCGGCT TATATGAAAT TATTCCTGGA TTTATTGTAA 114 00 

GTGTAATCGT TACATATGTT GTAAGTAAAC TTACTAAAAA AC CTGGTGCA TTTGTTGAAA 114 60 

CTGACTTAAA CAAAGTTCGT GACATCGTTA GAGAAAAATA ATTCATAAGT CTTAACAAAT 11520 

TAAAAAGGTA CTAATGTTAA TCAAAATTAT GACTAACATT GGTAC CTTTT TATTATCTTT 11580 
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AATTAAAGCA CGTGGTTGGT TACCATCTTT AATACGAATT TCATAGTTAT CGATTTTATC 1170 0 

GAAATATTTA TTCGCTTGTT CAGTAACGTA CTGTGTAATA CCAATTGTTT CAGCTTGTCC 1176 0 

5 ATAGTAATCG ATTGGTAAAT CTACTACTAA TCGTTGTGGC TTTTTATCAA CAAATTTAAC 11820 

TTTCCCTACT GCTTGTGTGA AATTAGAAAA ATATGATTGC AAATTATCAT T AAATTG CTT 11880 

GAAATTATTA TTTAAATTTT CATCATAATC TGCTGCTGTT GAAGAAGGTA ATAAAGCTGA 11940 

W 

TTTTTCATTG ATATTATGCC ATTCATTAAG CTTT G TTTGA CTCTTTTCTG CAGTCGCTTG 12 00 0 

AGTGATAAAT TCACCTGGTG TGATTGAATC TTCACTTGAT TGCTTATAAA TTGCAAAATG 12060 

AATTGGTATA TCTTTTAAAT CATCATTTTC ACGTAACCTT GATAATATCT CACTAGC CAT 12120 

15 

TTGTTTACCT TGCTTTTTAA CTcGCTATCA TCTAGTTTTT TACTAAAAGT CGATCCATCT 12180 

TTTTCTTTTT TATAGTAATA AACACTATTC ATAGCTAAAC CAATCGTCAT ACCTTTAATA 1224 0 

20 TTCTTACCTT TTGTATCTCC ACCACCATAA AAATCTTGCT CTAAAATGTT AGATAAATAG 12300 

GCTGGTGATT TTTCTGCAAT CTTTTCAGGA TCTGTTTCAC CTtCGTGTGA TGGATTAAGT 12360 

CCTAAATTTT CATTCGCTTT CTTGTCTTTT TTATCTTTTT CAGACATTTT ATCGATTTCA 12420 

25 CGTTTTGTAT ACTTAGGATT TAAATAGGCA TTAATTGTTT TCTTGTCCAA AAATTGACCA 12480 

TCTTGATACA AATATTTATC TGTTGGAAAT ACTTCTTTAC TTAAGTTCAA TAAACCATCT 12540 

TCAAAGTCGC CGCCATTATA ACTATTTGCC ATGTTATCTT GTAAAAGTCC TCTTGCCTGG 12600 

30 CTTTCTTTAA ATGGTAACAA TGTACGATAG TTATCACCTT GTACATTTTT ATCCGTTGCA 12660 

ATTT CTTTTA CTTGATTTGA ACTATTGTTA TGTTTTTGAT TATCTTTTCC AGCCTGGTCA 12720 

TCCTTATGGT TACCACAAGC AGCGAGTATA AAGATAGCTG TAATCAATAA TACTAATGTA 12780 

35 

CG CTT CATC G ACATACCCCT CTAACTATTT AATTCATTTT GCTTATCTAC AAATTG TTGC 12840 

TCTGTCCAAA TTTCAATACC TAAACTTTGT GCTTTTGTTA ATTTTGAACC TGCATCTTCA 12 900 

CCAGCAATAA CGACATCTGT ATTTTTAGTA ACGCTACTTG TAACTTTAGC ACCTTGTGAT 12 960 

40 

GCAAGCCATT TAGATGCTTC ATTGC GTGTC ATTTGATGTA GCTTACCAGT CAGTACTATC 13 020 

GTTTTACCAC TAAATTCAGG ATGTCCTTCA ATATCTGATG TTTTGATACC TTTATAAATC 13 0 80 

4S ATATTAACAT GTTTATCTTT TAATTTTTGA ATTAAAGCAC GAATATCTTC ATTTTCTAAA 1314 0 

TAAGTAACTA CAGATTGTGC TACTTTATCA CCTATATCAT GAATTTCTAC TAATTCCGCT 13200 

TCAGTTACCG TTAGTAATCG ATCTATCGTT TCATATTTTT CTGCTAACAC TTGGCTCGCT 13260 

50 TTAACACCTA AATGC CTAAT ACCTAGACCA AATAATAAAT TTTCTAAAGA GTTGTCCTTA 13 320 

GCTTGTTGAA TGGCAGCTAA TAAATTATCA ACTTTTTTCT GCCCCATTCT GTCTAAAGGT 133 80 
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TAAAGCTGTT GAATAATTTT AGTGCCTAAA CCATCAATAT TcATGGCTTG TCTTGaTACA 13 500 
AAGTGnATCa ATCCtTcAAC AAGTTGTGCT TGGTCATTTT GG 13 542 

(2) INFORMATION FOR SEQ ID NO: 155: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1893 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 155: 





CAGTAAACAC 


CTCTGATTAC 


GAATATTTAT 


ACATTTATTT 


TAACACATGC 


ACTGATTTAC 


60 




GACTACTAAA 


CACCTTTACG 


TAAAAAGGGT 


AAACATGGTT 


TATCTAT CTT 


GGTTATCTAT 


120 


20 


TTATAAATAT 


TTnTCATATT 


ACGCATAACA 


ATTGCTTAAA 


ATATGTATAA 


AAATGAATAT 


180 




ATGTGTAATA 


AACTTGCTAA 


TTATTAGATT 


TAATAAGCGT 


CAATTGTTTG 


AACATATTtA 


240 




ATTAAAATCA 


CATTGATATC 


ACAGATACGA 


ATATTGTCGT 


ATAGAAATTG 


AAAATTCTAT 


300 


25 


TTTTTAAATG 


AAAGTCTTCA 


ACATAATTTT 


AAGTTTCAAC 


ATGAGAAAAA 


TCGATTAACA 


360 




AACAACGTCA 


GTTGAATATG 


CCTTTTGAGA 


CATTTCAAAC 


TTTACAATTG 


TTGCTAATCG 


420 




ATATATTTGC 


TTTTAGTGAT 


CCCTGCTATA 


AAATAAATCA 


ACGATTTCTA 


ATAAGTGTTT 


480 


30 


TGTATTGAAT 


TGTTCATCAA 


TTTGCGTTAG 


TTCATCCACT 


GCTGCGTCTC 


TATGATAAGT 


540 




CAATTTATCT 


TCTGCGCCAT 


CTTTCCCTAA 


TAAACTCACG 


TACGTACTTT 


TATTATTTTC 


600 


35 


AAGATCGCTG 


CCCACTTTTT 


TACCTAACTT 


TGCTTCATCA 


CCATAGCAGT 


CTAATAAATC 


660 


ATCTTTAATC 


TGGAACATCA 


TACCTAAATG 


ATAACTATAA 


CTTTCTAAAT 


GTT CTTTAGT 


720 




tgtStcatcg 


ACATTAGCGA 


TATCTGCTGC 


ACTCATAACC 


GCAAAAGTTA 


ATAATGCTCC 


780 


40 


TGTTTTTGTT 


TTGTGTATCA 


TTTCCAAAGT 


TTCAAGATCA 


ATTGGTTGGC 


CTTCGCTTTG 


840 


CATATCTAAC 


ATTTGACCGC 


CGACCATTCC 


AACATGACCA 


CTTGCTATTG 


ACAGCCGTTG 


900 




TAGAACTTTT 


ATTTTTACTT 


CATCAGTTAA 


TCTATCATCA 


CTTGAAATAA 


GTTCAAATGC 


960 


45 


TTTAGTTAAT 


AAAGCATCAC 


CTGCTAATAT 


CGCAGTCCAC 


TCACCATATA 


CTTTATGATT 


1020 




TGTTAATTTT 


CCTCGTCGAT 


AAT CATCATT 


ATCCATCGCT 


GGTAGGTCAT 


CATGAATAAG 


1080 




TGAATATGTA 


TGAATCATTT 


CTAGTGCAAT 


TGCGCTCTTC 


ATACCTAACT 


CATACTCGGT 


1140 


50 


ATTTAGTGAA 


TCTAAAGTGA 


GTAATAACAG 


AACTGGTCGG 


ATGCGTTTAC 


CTCCAGCATT 


1200 




TAATGAATAC 


AACATACTTT 


CTTCTAGCTG 


AGTATCCATT 


ACTGATTTAT 


TTATCGCAAC 


1260 
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CATCCTCAGC TTCTTCTTTT ATTAAGTCAT TCACCTTTTT TTCGGCATTT TTTAAAGTTG 13 80 

TGTCACAAGC TGCTGATAGT TTCATACCAC GTTGATATAA ATCTAATGAT TC CTCTAAAG 144 0 

ATACTGTTTC ATTATCTAAT TTTTGAACAA TTTGCTCTAA TTCTTGCATC ATTTCTTCAA 1500 

AACTTTGCGT TTCTTTAGTC ATTATTACAC CTTACTTTCG TAACTTTTGC ATCTACTAAG 156 0 

CCATCTTTCA TTGTTAACGT CAATTGATCA TTTTCTGTTA AATCTTTAGT ACTCGTAATG 162 0 

ACTTCGT CTT TTTTATTAAC AATTGCATAT CCACGCAACA TTGTATTAGT TGGACTTAAA 16 80 

TTGTTTAAGT TTTCTACTTT ATTTTTCAAA TCATTTTTAT AACTTAATAT CTTAGAATTC 174 0 

AATAATTTAA CAAGTTGGTT TGTCAATTGA AGATTATnTT GTTGTTCTTG ATTAACACTA 1800 

CTTAGTAATG CTTTTAAATn ATAA CGTTGG TGCAACAGCA TTAAATCGAG GCCCCGGTGG 1860 

TCCAAAGTTG CCCGAATTnG TGGTTTCAGG CCC 18 93 
(2) INFORMATION FOR SEQ ID NO: 156: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 156: 

AAAATATATT CCTTCACTTA ATATTCAATT AGAGAAAAAC ATGGTGATTG TAATATGTTG 6 0 

TGCAATATTT CTGGGTGTTT TAATA CTTTT TTTATTTCTG AATCGTAAGC TAAGGTTGGA 120 

AATTTATAAT AATAACTCTA GTAAAGGGAA AATAATTTTA TTTCCTTCAT TAAAAAACTT 180 

TTGTTTCACA ATATTTTATT ATTTTTTATT TGGCGGTCTT TCAATAATGG CTCTAAGTAT 24 0 

GTTATTAACT TTAAATCCTC AAAATATAAT AGGCTTTATT GGTTGGTTGG TAATGACTGC 3 00 

AGGTTTCTTT CTGTTAAACA TGTCATCGAT TATTGACAAA AAAATTTATG TATTATCTAA 3 60 

AACTAACACG GTGGAAAAAT GATGGTTTAG CTGGATTTAC TGCAGGTTCT ATTTCGGCAA 42 0 

TACTTGTATA TTGGACCAAT CAAAAAAATG AATTTGGAAT AAAAGATAAA AACGATTGGA 4 80 

TAGGACATAA ACTAGACGTT GGTATAGATG CTGTAGAAAA ATCTGCAGAA AAAACAGTAG 54 0 

ATGGTGTTGA AAATGTCATG GTGAAGCTTC AAAAAGTATT TCTAATCATA TAAGCCCTAA 6 00 

GAAATGGAGC TGGTAAATGT TGCTATGCGA ATCTAAAATC ATCAATAAAA ACCCAAAATA 660 

TAGAATTATT AAATATAATG ATGAATACTT AATGGTCGAT ATAATAAGCA CTTGGATTAG 72 0 

TTTATTTTTT CCTTTTATTA ATTGGTTCAT CCCaAAAGaA TACGTCAAAA TTAGTAGAGA 780 
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(2) INFORMATION FOR SEQ ID NO: 157: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 234 3 base pair 
(3) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 157: 

AGTAAGATAA TTTTCAATTA GAAAATATCT TACTGCTGTT CTCTATTTAT ACAATACTTC 60 

GTATTGAATG GcTTCGCTTT CCTAGGGTGC CGTCTCAGCC TTGGTCTTCG ACTGGCACTG 120 

CTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACAT GTAATTTTAC TTTGAAATAC 180 

TTTTAAAAAA TAAGACACTT TGCCCAACTT GCACATAAAT GTAAAATTCA ATAAAATGAA 24 0 

TTTTCTGTGT TGGGTCCCTT CTTATAATTT AATAAATACC ACTAAACTAA ATTAACGAGG 300 

TGCCTTATGT ATAAAAATTA TAACATGCCC CAACTACACT AC CAATAGAA ACTTCTGTTA 360 

GAATCCCTCA AAATGATATT TCACGATATG TTAATGAAAT TGTTGAAACr ATACCTGATA 420 

GCGAATTCGA TGAATTCAGA CATCATCGTG GCGCAACATC CTATCATCCA AAAATGATGT 4 80 

TAAAAATCAT CTTATATGCA TATACTCAAT CTGTTTAATT ATGTTCAAAG CATTAAGGTA 54 0 

ACAAGACAAT ATCTAAGATA TCAAAGATAG AAATTTTTTG ACGTTGTTGC TGATTGTAAA 6 00 

CATAACCATC AATTTCATAA TTAATAGCAT CAATACGATA AATGGTTAAG CGTACTGAAT 660 

CTACAAAGCC ATTATTATAA AATTTAACTT CTACAGGTTG GGCATATTGT AGCGCCTCGT 720 

GTAGCCGAAT GTTTAGCTCA GCCAATTGAT CAT CTG ATAA TACAGGACGT GTAATTTTGT 7 80 

TTTGGT CGAT AATGTATTGT TGAATCGTTT CGAATTGTTC GGGTAAT GTT GCAAAAGGAG 84 0 

CCCATTTAAT CATGCCTCTT CCCATAGGTA TATTGTTATC TAGTAATTCT CTTGGAACGT 90 0 

TACGATAATC AGTTTCTTCT TCATAACTTG TCATCCTTAA TTCACCCCAA TCTGATAATT 96 0 

ACATTATACG AACATGTGTT CTATTTTGCA ACAAAAATTT TGTGGaAGCA TAAACGCGTT 102 0 

AATAATTAAT GCTCGTGtAA GTAAAAAAGA GGGATTAATT AAAATCGAAT AATGa CATAT 108 0 

CAC a GCAAAT AGTT CTTT TA AAGTAGTTAA ATAGTTTTAG CTTTAAGGAA aTGATAAaTG 114 0 

ATTGTwAATT CTAGCTAAAA TTTAATAAAA TGAAAATAAG ACTAACATGG AGGGGTAAAA 1200 

GTAATGACAA ATGGATATAT TGGTTCTTAC ACTAAAAAGA ATGGTAAAGG GATTTATCGT 126 0 

TTTGAATTAA ACGAAAATCA GTCACGTATT GATTTATTAG AAACAGGATT TGAATTAGAA 132 0 

GCGTCTACAT ATTTGGTGCG TAATAATGAA GTTTTATATG GAATCAACAA AGAAGGAGAA 13 B0 
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TGTTTGTCTT CAAAAGCTGG TACAGGTTGT TATGTATCGA TTTCAGAAGA TAAACGATAT 15 00 

TTATTTGAAG CGGTATATGG TGCTGGCATC ATACGTATGT ATGAATTAAA TACGCACACA 1560 

GGTGAAATTA TACGTCTAAT TCAAGAACTT GCACATGATT TTCCAACAGG TACACATGAA 162 0 

AGACAAGATC ATCCACACGC ACATTATATT AATCAAACTC CAGATGGTAA GTACGTTGCA 16 BO 

G TAACAG ATT TAGGTGCTGA TCGTATCGTT ACTTATAAAT TTGATGACAA CGGGTTTGAA 174 0 

TTTTATAAAG AATCTTTATT TAAAGATAGT GATGGGACAA GACATATTGA ATTTCATGAT 18 00 

AATGGAAAAT TTGCTTATGT CGTACACGAA TTATCAAATA CTGTGAGTGT TGCAGAATAT 18 60 

AATGA CGGTA AATTTGAAGA GCTCGAGCGT CATTTAACAA TTCCTGAAAA CTTTGATGGA 192 0 

GATACTAAAC TTGcAGCAGT GCGTTTATCT CATGaTCAAC AATTCTTATA TGTATCTAAT 198 0 

AGAGGGCATG ATAGCATTGC AATTTTTAAA GTT CTTGATA ATGGTCAACA CTTAGAACTA 2 04 0 

GTAACAaTTA CTGAAaGTGG TGGTCAATTC CCAAGAGATT TTAATATTGC CTCATCAGAT 2100 

GACCyTTTAG TTTgTGCTCA kGaGCaAGGA GATTCAGTTG TAACTGTTTT CGAAAGAAAT 2160 

AAAGAAACAG GTAAAATTAC GCTATGTGAT AACACTCGTG TAGCATCTGA AGGTGTATGT 22 2 0 

GTCATATTTT AATCTTTAAT TAATCATGAT AAAAAGAAAA CCATGTTTCC AAAAAATTTG 2280 

TGTATACCTT GAAATTTATT GnTTTCCAGn ACATCAATTA TGGGAAGCAT GGnTTATTTT 2 34 0 

TGT 234 3 
(2) INFORMATION FOR SEQ ID NO: 158: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4837 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 158: 

AAATTGCCAG TTGGTATCGC TTCTGGTGCA GTAGTCGAAG GTTTCTTCCA AGGTATCATT 6 0 

CCGATTGGCT ATATCGTTAT GATGG CAGTA TTGTTATACA AAATTACTGT TGAATCTGGA 12 0 

CAATTTTTAA CAATTCAAGA TAGTATTACA AATATTT CAC AAGACCAACG TATTCAAGTT 180 

TTACTTATTG GATTTGCATT CAACGCATTT TTAGAAGGTG CAGCAGGATT TGGTGTACCA 240 

ATTGCAATTT GTGCACTTTT ATTAACACAA TTAGGATTTA ATCCATTAAA AGCTGCGATG 3 00 

TTATG TTTAG TCGCAAATGC AGCGTCTGGT GCTTTTGGTG CGATTGGTAT CCCTGTAGGT 360 

GTTGTAGAAA CGTTGAAATT ACCTGGAGAT GTTTCAGTAT TAGGTGTTTC TCAATCAGCA 4 20 
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GGTTTTAGAG GTGTTAAAGA AACATTACCA GCAATTTTAG TAGTTTCAAT CACTTATACA 54 0 

CTTA CTCAAG GATTATTAAC TGTATTCAGT GGACCTGAAT TAGCAGATAT TATTCCACCG 600 
TTATTAACAA TGTTAGCATT AGCAGTATTT TCTAAAAAAT TCCAACCAAA ACACATTTAT 6G0 
CGTGTTAATA AAGATGAAGA AATTGAACCT GCAAAAGCAC ATTCTGCAAA AGGAGTATTA 720 
CATGCATGGA GCCCATTCAT TGTATTAACA GTCATTGTAA TGATTTGGAG TGCGCCATTC 780 
TTTAAAAACT TATTCTTACC AAATGGTGCT TTATCATCAT TAGTATTTAA ATTCAACTTA 84 0 

CCTGGaACAA TCAGCGAAGT TACGCATAAA CCATTAGTAT TGACTTTAAA TATTATTGGA 90 0 

CAAACAGGTA CAGCTATTTT ATTAACTATT ATTATTACAA TTTTAATGTC TAAAAAGGTT 960 

AACTTTAAAG ATGCAGGTAG ATTATTCGGC GTTACATTTA AAGAGTTGTG GTTACCAGTT 102 0 

CTTACAATTT GTTTCATCTT AGCAATTTCT AAAATCACAA CTTATGGTGG TTTAAGTGCA 10 80 

GCAATGGGTC AAGGTATTGC TAAAGCAGGT AATGTCTTCC CAGTTCTATC ACCAATTTTA 114 0 

GGTTGGATAG GTGTGTTTAT GACAGGATCA GTTGTAAATA ACAACTCATT ATTTGCACCA 12 00 

ATTCAAGCTT CTGTTGCACA ACAAATTGGA ACAAGTGGTT CACTTCTTGT ATCTGCTAAT 1260 

ACAGTTGGTG GTGTAGCGGC AAAATTGATT TCACCACAAT CAATTGCAAT TGCAACTGCA 132 0 

GCAGTAAAAC AAGTTG GTAA GGAATCAGAA TTATTAAAAA TGACATTGAA ATACAGTGTA 13 8 0 

TGTTTACTAA TATTCATCTG TATTTGGACT TTCATCTTGT CATTATTATA AAAAAACGTA 144 0 

TTTCAAAATA TAAATATACA GAAGGTGAGA TGTTTTCTAA CATCTCATCT TTTTTTTATG 1500 

GATCATTAAT GAAAGAAGTT TGACATTATA ATAATGGTAG CGCTTTATGT TAAAATGAAT 15 6 0 

AGTGAGTAAT CAGCAATCAA ATTAAATTGG TTGATAGCTG TTAAGGTTTG TGGTTTTGTC 1620 

TTTGTGCTAT CGCnCATAAA GTATATAATT AAAGTAGTTT CGTTATTATA AAATATTAAT 16 80 

ATACATAGTA GATAGTAATA GAGCATCACC ATGGGAACCT ATTGAGACAC TTATTGATTT 174 0 

AAAGTGGTAT TAATATGTCG TATTTCTCGA ACGTTCCATT ATTCATTTTA AAAAGGGGGA 18 00 

CTGTATTTGT TATGACAACA CAACATAGCA AAACAGATGT CATCTTAATT GGTGGCGGTA 18 60 

TTATGAGTGC aCATTAGGAA CATTACTTAA AGAATTATCA CCTGAGAAAA ATATTAAAGT 1920 

GTTTGAAAAA TTAGCACAAC CTGGCGAAGA GAGTTCAAAT GTATGGAATA ATGCCGGTAC 1980 

AGGGCATTCA GCACTTTGCG AGTTGAACTA TACAAAAGAA GGTAAGGATG GCACAGTTGA 2 04 0 

TTGTAG T AAA GCAATTAAGA TAAATGAGCA GTACCAAATT TCAAAACAGT TTTGGG CATA 2100 

TTTAGTTAAA ACAGGACAAT TAGATAACCC AGATCGCTTT ATTCAAGCGG TGCCACACAT 2160 

GAGTTTTGTC ATTGGCGAAG ATAATGTAGC TTTTATAAAA AGTCGTGTTG CAACGTTAAA 2220 
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GGTAC CGTTA ATGATTGAAG 


GTCGTAAGTC 


TGATGAACCA ATTGCTTTAA 


CTTATGATGA 


2340 




AACTGGTACa 


gATGTTAACT TTGGTGCGTT AACTGCAAAG TTATTTGATA ATTTAGAGCA 


2400 




ACGTGGTGTG 




ATAAGCAGAA 


TGTATTAGAC ATCAAGAAAC 


AGAAATCT GG 


2460 




GGT AT GG CT A 


G'riAAAGTTA 


AAGATTTAGA 


AACTAATGAA ACGACAACAT 


ATGAATCTGA 


2520 






ATTGGTG CTG 


G CGGTGCGAG 


TTTACCATTA CTCCAAAAGA 


CTGGGATTAA 


2580 


10 


ACAATCAAAA 


CATATTGGTG 


GTTTCCCGGT 


AAGTGGATTA TTCCTGCGCT 


GTACAAATCA 


2640 






GATCGTCATC 


ATGCTAAAGT 


GTACGGAAAA GCAGCAGTGG 


GTGCGCCACC 


2700 


15 


AATGTCAGTG 


CCGCACTTAG 


ATACACGTTT 


TGTAGACGGC AAGCGTTCAT 


TGTTATTTGG 


2760 




TCCATTTG CA 


GGTTTCTCAC 


CTAAATTTTT 


AAAAACAGGT TCACATATGG 


ATTTAATTAA 


2B20 




ATCGGTTAAA 


C CAAATAATA 


TCGTGACGAT 


GTTATCTGCA GGTATCAAAG 


AAATGAGTCT 


2880 


20 


T AC GAA GTAT 


TTAGTGTCAC 


AATTGATGTT 


AT CTAATGAT GAGCGTATGG 


ATGATTTAAG 


2940 




AGTCTTTTT C 


CCAAATGCTA 


AAAATGAAGA 


TTGGGAAGTG ATTACAGCAG 


GGCAACGTGT 


3000 




CCAAGTAATC 


AAGGATACTG 


AGGATTCTAA 


AGGTAACTTA CAATTTGGTA 


CTGAAGTTAT 


3060 


25 


1 AL-Lj 1 L-ALjA 1 


GATGGCACAT 


TAGCTGCATT 


ACTTGGTGCA TCACCTGGTG 


CGTCAACAGC 


3120 




TGTAGATATT 


ATGTTTGATG 


TTTTACAGAG 


ATGCTATCGT GATGAATTCA 


AAGGATGGGA 


3180 






AAAGAAATGG 


TGCCGTCATT 


TGGTTATCGC tTAACAGATC 


ATGAGGATTT 


3240 




AT AT CAT AAA 


ATTAATGAAG 


AAGTAACTAA 


GTATTTACAA GTTAAATAAT 


AAACGAAACG 


3300 






TTTTAATGTG 


ATAGACATTA 


CCGTTTTTTA GTGGTTAATA 


AAAATCATTT 


3360 




TAATTGTTTC 


AGTTGCTTGT 


TAATAGTGTC 


TACGTAGTTC TTGTTTTTAA 


AGAATTGAAT 


3420 


35 




AATACATAAA 


CCACAATGAA 


GATAATTGTG AATATGATTA 


GATAATGCAC 


3480 




TGTTAGTGGA 


AACCAAC CGG 


CAAGCATTGC 


TAAAGGCAAG AATCCGACAT 


ACGTTGTTAT 


3540 


40 




ATAGTTGCTT 


TAGTAATGCT 


CCAATCTGTG TATTTAAAGA 


TAAAATCTCC 


3600 


AAGGAAAAAG 


ACGACGCCTA 


TGAGTAACCA 


TAAAATGATA GAAATCAACA 


TTACGGTAGT 


3660 




TTCTGTGAAA 


TGCGTATAAT 


ACAATATGCC 


AATAGTTGAT TGTGGGTTCA 


GTGGATAATA 


3720 


45 


TTTGCCGTCT 


GCAAATAACA 


TACTAAAGAA 


CAGTGAAAGG GACAAACCAA 


TGATTAAGCT 


3780 




AATAAATAAT 


GAGTTTTTCA 


AATTTTTCAT 


ATTGATAAGC GCTCCTTTAT 


AGATTTTAAA 


3840 




TAACGTCTAG AAGAATAGGT 


GTAGTGTGCA 


TCTTTAAGAT ACATACGTAT 


AAGTCCATTT 


3900 


50 


GGCTCTAATA 


ATAATTTTTC 


AATGTAATAC 


TTGTTGACGA TTTCTGATTT 


GGAAATGCGA 


3960 




ATGAAATGTT 


GTGGTAACTG 


TTTTTCTAGT 


TCATAAAGTC GTAATTTTAG 


TTT G AATTTT 


4020 



ss 
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ACATTAATGA TATGGATTTC TTTGTCTATG TATCCGACTA ATGTATGTGA TTTGTCTAAA 414 0 

TCATTGACTG CATTAATAAT ACTTTGAACG TTATCATTCA TTTTAGGTGC ATGTATATCA 4200 

5 ATATAAGATT CCGTCTCATT TGCATTGATA AATAAATTGA GTTTCATCAT AGGTTAATGC 4 260 

CTCCTTCAAA ATTATTAAAC CATAAATGAC CATCGATATA TTTAAATTTT GTTGAATGGT 4320 

AGAAATTAAA TGTTAAGTGG CTAGAAAGCG CTAATCAATA TAAAAGATAC CTCCTGAAAT 4 3 80 

10 

AAAAACAGAA ATGTTTTTTC AGGAGGTAGA GATTAAAGTG AATTATTTGG CAGTGTAATA 444 0 

GTAAAGGTGG TTACATACTC GTTACTTTGT GTGAATTGGA TTGTACCATG ATGCAATTCA 4 500 

ATGATGGATT TTGTAATTGC AAGACCTAAA CCATTGCTAT TATCATGTTT GCTCACTTTA 456 0 

15 

TAAAAACGTT CAAATAAACG TGCTTCAGCT TGTGGACTAA TTGGTGAACC ATCATTACTT 4 620 

ATTGTGAAAA TGATATTGTT GTGACTATGT TGCAAAGCGA TGTCAATGGC ACCACCAACA 4 680 

so TCTGTATACT TAATAGCATT TATTAATAAA TTACTCAATG CTTGATGTAA CAAACGTTGA 474 0 

TTTCCTAGGA AATTGATGAT TCTAGGTCAG CTAAnATGAT TAACGACTTT TCATCAGCAG 4 800 

CAnATTGTTC ATGTCGAATG ATATCnTTAA TGAGCTG 4 83 7 

25 (2) INFORMATION FOR SEQ ID NO: 159: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1600 base pairs 
(3) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
30 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 159: 

35 

ACAATTATTG GATTATTATC AAGCAACGTT AATGGATGAC TTCCACTTAC AACAGAAATG 60 

CCCATAGATT CTAAATCTtT TGCATGAGCA TCTTGTGATA AGTCTTTTCC AT CATTGACA 12 0 

GTTACATTCG CACCTAATTT ACTTAATAAT TTAGCTGCTT CATAACCACT TTTTGCCAAA 180 

40 

CCGACAACTA ATACATTTTT ATTTTCTAAC CCTGTATAAT TAAGCATCTT AATGCACTCC 24 0 

AATCCATAAA CCGATTAAAC CTGAAATCAG ACCAACAGCC CAAAATACTG TAACTACTTT 300 

45 CCATTCGCTC CATCCTATCA ATTCAAAATG ATGATGAATC GGACTCATTT TAAATATACG 360 

CTTTCCAGTC AATTTAAAGC TAGCGACTTG TAACATAACA GATAATGTTT CAATTACGAA 420 

TACTAAACCT ATAAAAATTA ATGATAATTC CTGATTAAGC ATGATTGAAA TGGTAGCAAA 4 80 

50 TATACCACCT AAAGCTAAGC TACCTGTATC TCCCATAAAC ACTTTAGCAG GGTTAATGTT 54 0 

ATATGGTAAA AATCCTAAAA GTGCAAACAA CATAATGATA CAGAAAATAC CAATTGCCGT 600 

£5 
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TGCTAATCCA TCTAAACCAT CTGTTAAATT TACTGCATTA GAAAAACCTA CTTGCCAAAA 72 0 

AACAATGAAA ATAACATATG CAAATGATAG TGGGATTGCT ACATTCGTAA ATGGAATATG 780 

5 TATGCTCGTA GAAAAATTCA CCAAATGAAA CACATTACTT AAAACAAAGA ATATAATCGC 84 0 

AATACCAATT TGCGCCAAAA ACTTCTGTTT ACTTGTTAAA C CTTGGTT AT TCTTTTTAAC 900 

AACAATAATA TAATCATCTA TAAAACCAAT TAACCCAAAA CCAATCGTCA CAAATAATAA 96 0 

W 

CAGTATGATT GGATTAGCTT GATCTACAAA TATAATAGCC ACCAAAGACG TTATCACAAT 10 20 

ACTTAATAGA AATGTTAGTC CACCCATCGT TGGTGTACCA GTCTTCTTCA TATGGCTTTG 10 8 0 

TGGACCTTCT TCTCGAATAC TTTGACCAAA TTTCATCCTT TTTAATGTAG GTATTAAAAC 114 0 

IS 

AGGTACCAAA ACAAATGTAA TCACTAGCGC TAATAACGCA TATACAAAAA TCATAACTAT 12 0 0 

CTCCTCTTCT TAATCCAGAC TTTTTTAACC ACTAATATAT TATCAATTTT TCAATTAAAT 12 6 0 

20 AAACAAAGTT GTAATCAAAA TTTATAATTT TTCTTTTTTA CGGCATAAGA GGCCAGTATA 132 0 

AAAAGTTTGC CTATAACAAA CAAGTTAATC TGACCTCGTC TACCTTAAAA TTCTCTATCA 13 8 0 

ACACTTATTT ATAAAGATTA AATGAAGATG TTGTTTTCTA TCACAGCATT ACTTTAGTAA 144 0 

25 AAACAAATAG TGACAATACA TCCTAATTTA ATGTAGCCAT TCTTGTTAGT CCGACTTATC 150 0 

CTTGTCAGTT TTACTGTCAG ATTTCnTCTT ATCATCTGAA TTTGAATCAG AATTATTCGT 156 0 

CGAATTGCTG TCTACATTCT CTGGATGGAA AATTCTACGT 16 0 0 

50 (2) INFORMATION FOR SEQ ID NO : 160: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1186 base pairs 
(3) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 160: 

ATTGCCTTTG TTTTAATTTT AAATCAAAAT mGCCTATGAA AGATTTAAAT CAATTAATTT 60 

CTATAATATT AT CATTTTTA AAGCATATCA TTGTTTAGTT TTTTTATAAT TGGATAAATA 12 0 

CTAATAGTTA CTTTATAAAA CATTACATAG AGAAAGGTTA AGGAGTGCAC ATGTCGAAAA 180 

AGGATCACTC TTCTTCAAAA TACCTTAATT CTGTTAAGGA AG CGCAAGAG GAGTCAAAAA 24 0 

AGAAAAATAA AAGTAATCCC AAAATTGATG TTGATCGTAC ATATATTGAA CCTCAACAAT 300 

TCCAATCTAA GAAACCTAAA AAAGATGATC AGGTTTTCTT CTTATCAAGA TTAAATAAAC 36 0 

CTGCAAAATA TAAGAAAGAC T CTAATTTCT TATCATATCT CATCTATCGC ATAGGAAAAG 420 



55 
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TGTTGCTTTT CCTATTAACA TTATTACCAT TTTTCAATAT TAAGCAGAGT CAAATTACTA 54 0 

ATATG TTAAG CAATGCACCC GCTGAAACAT CTACTCTAAT TAAGAGTGTA ATTGGTGATA 60 0 

TAACTCAAAA CTCCAGTGGT GGCTTATTAT CTATCGGTTT GATTTTAGCA ATTTGGTCAG 66 0 

CTTCAAATGG AATGACTGCA ATTATGAATT CTTTCAATGT TGCTTACGAT GTAGAAGATA 72 0 

GCCGTAATGG AATCGTATTA AAA CTACTAA GTGTTGTCTT CACTGTAGTT ATGGGCGTTG 780 

TGTTTGTAGT TGCTCTAGCA TTACCAACGC TTGGTTCTGT AATTAGTCAT TTCCTATTCG B4 0 

GTCCACTTGG aTTTGACGAA CAAGTGAAAT GGATTTTTAA CCTTATTAGA ATTGTGTTAC 90 0 

CAATCATTAT TATATTTATC ATATTTATCG TGTTATATTC GGTTGCACCT AACGTTAAAA 96 0 

CGAAGCTTAA GTCAGTATTA CCAGGTGCAG TATTTACTTC AATTATTTGG TTAG CTGGTT 102 0 

CATTTGGTTT TGGTTGGTAT ATTTCAAATT TTGGTAACTA TTCTAAAACA TATGGCAGTA 108 0 

TCGCGGGTAT CATCATTTTG TTACTATGGT TATATATCAC AAGTTTTATT ATAATTGTCG 114 0 

GnGCTGAAAT CAATGCAATC ATTCATCAGC GTAGTGTAAT TAAAGG 1186 



(2) INFORMATION FOR SEQ ID NO: 161: 

25 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 7872 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 161: 

TCTTGAGCCA TCTTTTGAGC TAACTGACTA GATTGATACC CAAAAATCAT AGTTACCAAC 6 0 

35 

ATAAACTTTA ATTTTACCGA AGTCTAAATC AGCGATATGA GTACATACAT TATTTAAGAA 12 0 

ATGACGGTCA TGCGATACTA CGATAACAGT ATTATCAAAG TTAATTAAGA AATCTTCTAA 18 0 

CCAACTGATT GCTGGAATAT CGAGACCGTT AGTAGGCTCA TCCAGTAATA GTACGTCTGG 24 0 

TTCACCGAAT AAACTTTGCG CTAATAATAC TTTAATTTTT TGGTTGTTTT CTAATTCAGC 300 

CATTTTTTTA TCGTGTAAAG TTGGATCGAT ACCTAAACCA GATAAAAGGT TAG CAGCATC 3 60 

45 AGCTTCAGCA TTCCAACCAT TCATTTCTGC AAATTCACCT TCAAGTTCAG CAG CACGGAT 420 

ACCATCTTCA TCACTGAAAT CTGGCTTCAT ATAGATTTCA TCTTTTTCTT TCATAACCTC 480 

ATAAAGACGT TCGTGACCTT TAATTACAAC ATCAAGCACG CGTTCATCTT CATAAGCATA 54 0 

50 GTGGTCCTGT TTTAAAACAG CTAGACGTTC ATTTTTCCCT AATGAAACAT GTCCTGTTTG 6 00 

AGAATCTAAT TCACCAGATA ATATTTTTAA GAATGTTGAT TTACCTGCAC CATTCGCACC 660 

ss 
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ATCTCCAAAA CGTAAACTCA CATCAGTTAC 
TCGATATTCT AACGGAAGAA TTATAT CAT A 
5 TGTAATGATA GAATGACTCA CACATGTTAT 

ATAACATGGC ATTAGACAAA GATATAGTAG 
TACAAGGTTC AACTT AC CTT TTAAAAGGAC 

to 

CAGAAATGAA CGATGATGAT GAATTAGAAG 
CAAACCGTTC AGGTGAATTA TTTGCAACTC 
ATGACTTTGC TAAAGTACTT AAAACGGATC 

15 

CCCGTGAAGT GTTAGTACCA TGGGAAGATT 
CTGGTGATTA TTTGCTAGTT ACATTACGAA 

20 TAGCGAGTGA ATCTGTTGTA GAAAATATGT 

ACGAaGTCAT TGAAGCCAAA CCTTACCGCG 
AATCAGGTTA CAAAATTTTC GTACATGAAT 

25 AATCTGTTCA AGTTAGAATT ATCGGGCATA 

TACCACTTGC ACATGAACGT TTAGACGATG 
AATATGATGG TGAATTACCA TTCTGGGACA 

30 TCAATATGAG TAAAGGTTCA TTCAAACGTG 

TTAATATAGA AACAGGTAAA ATCGCTTTAA 
AAGAATAATC ATTTTTACAC GTGTCGTAGG 

35 

GGACAGATGA AGTAGTTTTT TAAACATTCC 
GAATAGG CTG GGaCATTAAG TTCTTAGGCA 
TGATGGAAAT CAGCTTTTTT GATATGTATT 

40 

TTCCTTATAT TAAGTGC CAT TAATACAAAA 
CGAACTGACA TTCGAGTGAA aCCCAAAATA 

4S TAAATTTTTC TATGACTATA GATTTTTTTC 
TGGGCTTTAA TGTATTTCAA AGTAAAATTA 
TCCTGAGGGA GCAGTGCCAG TCGAAGACAG 

SO AG CTTACAAC AATGTGCCGG TTGGGGTGGC 

TCAAAAATTC TATTTATAGA ATTTTACAGT 



TTGTAACATG CATTTTCT CC TTTTTTTCAT 7B0 
TTATCGTCAC AGTTTCGACC TCATATAAGT 84 0 

AATAATAAAG AATACAAGAA TCGAAGGAGA 900 
GTTCTATAGA ATTC CTTGAA GTAGTAGGGT 96 0 

CAAACGGTGA AAACGTAAAG TTAAACCAAT 102 0 

TAGGTGAAGA ATATAGTTTC TTCATTTAT C 10 BO 

AAAATATGCC TGATATTACG AAAGATAAAT 114 0 

GCGATGGGGC ACGTATAGAT GTTGGATTAC 1200 

TACCAAAAGT GAAATCACTA TGGCCACAAC 1260 

TTGA CCGTGA GAATCATATG TATGGACGTT 13 20 

TTACACCTGT ACACGACGAT AATTTAAAAA 13 80 

TATTACGAAT TGG TAG CTTT TTATTAAGCG 14 4 0 

CAGAACGTAA AGCTGAACCA AGATTAGGTG 15 00 

ATGATAAAGG TGAGTTAAAT GGTTCATTTT 156 0 

ACGGC CAAGT CATCTTTGAT TTACTAGTTG 1620 

AATCAAGCCC TGAAG CGATT AAAGAAGTAT 16 90 

CAATCGGTCA CTTATATAAA CAGAAGATTA 174 0 

CTAAAAAAGG TTGGAGTCGA ATGGACTCAA 1800 

ATGCGTGTTT TTTTTATTCA ATATTAAATC 18 60 

TTTCAAAGTA AAAAATTAAA TAATTCAAAC 192 0 

ATGTAAAAAA GCTGATTTCT ATTAATTATT 198 0 

TTATAATGTA CAGCTCGTTG AG CTGCTATT 204 0 

CCTAGCTCTC GTTTAACTTT ATTTATTCCT 2100 

GCCTTCATAA ATCCAAAAAC AGGCTCTACA 2160 

GTTTCTGGTT CAGAAAGCTT TTGaTTAATT 222 0 

CATGTTAATA CGTAGTATTA ATGGCGAGAC 228 0 

GGGCCCCAAC ACAGAAGcTG ACATATAGTC 234 0 

TGAGACGGCA CCCTAGGAAG GGACCCGTCA 24 0 0 

AATGTGACAG ACGGG CAAAG CGAAgCCATT 24 6 0 
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CTTACTGCTG TTTTTTTAGG GATTTATGTC CCAGCCATTT TTGTATTCAT ATTTAAATTT 258 0 

CGATAATTTT TCAGGAAGCA TTTTAATTTT ACTAATGAAG CAATATTTTT TAGATTAACA 264 0 

AAAATTAATA TTTACATTTT CTTAACAATT TTTTATGTAA CATTTACAGT TTCTAAAAAT 2700 

GAGGTTAATA ATTCAAGGTT AAGATAAAGA TGTAATCAAT ACAAATACTA TTTGTTGTT C 2760 

ATACAGGGAG GATATTTCAA TGAAAAAATG GCAATTTGTT GGTACTACAG CTTTAGGTGC 2 82 0 

AACACTATTA TTAGGTGCTT GTGGTGGCGG TAATGGTGGC AGTGG TAATA GTGATTTAAA 28 80 

AGGGGAAGCT AAAGGTGATG G CTCATCAAC AGTAGCACCA ATTG TGGAG A AATTAAATGA 2 94 0 

AAAATGGGCT CAAGATCACT CGGATGCTAA AAT CTCAGCA GGACAAG CTG GTACAGGTGC 3000 

TGGTTTCCAA AAATT CATTG CAGGAGATAT CGACTTCGCT GATGCTTCTA GACCAATTAA 306 0 

AGATGAAGAG AAGCAAAAAT TACAAGATAA GAATATCAAA TACAAAGAAT TCAAAATTGC 312 0 

GCAAGATGGT GTAACGGTTG CTGTAAATAA AGAAAATGAT TTTGTAGATG AATTAGACAA 3180 

ACAGCAATTA AAAGCAATTT ATT CTGGAAA AGCTAAAACA TGGAAAGATG TTAATAGTAA 3240 

ATGGCCAGAT AAAAAAATAA ATGCTGTATC ACCAAACTCA AGTCATGGTA CTTATGACTT 33 0 0 

CTTTGAAAAT GAAGTAATGA ATAAAGAAGA TATTAAAGCA GAAAAAAATG CTGATACAAA 3360 

TGCTATCGTT TCTTCTGTAA CGAAAAACAA AGAGGGAATC GGAT A CTTTG GATATAACTT 342 0 

CTACGTACAA AATAAAGATA AATTAAAAGA AGTTAAAATC AAAGATGAAA ATGGTAAAGC 3 4 80 

AACAGAGCCT ACGAAAAAAA CAATTcAAGA TAACTCTTAT G CATTAAGT A GACCATTATT 354 0 

CATTTATGTA AATGAAAAAG CATTGAAAGA TAATAAAGTA ATGTCAGAAT TTATCAAATT 360 0 

CGTCTTAGAA GATAAAGGTA AAGCAGCTGA AGAAG CTGGA TATGTAGCAG CACCAGAGAA 3 660 

AACATACAAA TCAGAATTAG ATGATTTAAA AGCATTTATT G AT AAAAAT C AAAAATCAGA 3 72 0 

CGACAAGAAA TCTGATGATA AAAAGTCTGA AGACAAAAAA TAATAAGACG CAATTTCAAA 3 78 0 

TGTGTCTTGA AACATGATTT TGATGGTGAA TCATTATTTA GAGTACAAAG CTTGATTTAT 3 840 

CGAGACGCTG ATTTTGACAT TCAGTTAGTC TAcAAGCTTA TCAACTTAAA ATAGTGGTTC 3 900 

ATCATTATTT TACAAATCTA ATTATTTTGG GAGTAATAGA AAGAGGTTTG ATTATGACTT 3 960 

CATCTACTAA TGTTAAAGCT TTAAT CG AAA AAAATAATAA TAAAAAAGGA AAG CATAATG 4 020 

ACAAAATTAT ACCAGTTATT TTAGCCGCAA TTTCAGCGAT TTCCATTTTA ACAACACTAG 4 08 0 

GTATATTAAT CACATTGCTT TTAGAAACCA TCACTTTTTT CACCAGAATT CCAATAACTG 414 0 

AATTTCTATT TTCTACTACT TGGAATC CTA CCGGTTCAGA CCCTAAGTTT GGTAT CTGGG 4 2 00 

CATTGATAAT AGGGACTTTA AAAATCACAG TTATTGCGAC TATATTTGCA GTTCCAGTCG 4 260 
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AACCGATATT AGAAATTTTA GCAGGAATAC CAACAATTGT GTTTGGTTTC TTTGCATTAA 4 3 80 

CCTTTGTTAC ACCAGTATTA AGATCTTTCA TACCAGGTCT TGGAGAGTTT AATGCTATAA 444 0 

GTCCCGGCTT AGTTGTCGGT ATTATGATTG TCCCTCTCAT CACAAGTTTG AGTGAGGaTG 4 500 

CAATGGCATC TGTACCAAAT AAAATT CGAG AAGGTGCCTA TGGACTTGGA GCAACTAAAT 4 56 0 

TAGAAGTAGC AACTAAAGTC GTACTTCCCG CAGCAACATC AGGTATTGTA GCTTCAATCG 4 62 0 

TTCTCGCGAT TTCAAG AG CA AT TGGAGAAA CGATGATTGT AT CATTAG CG GCAGGTAGTT 46 80 

CGCCAACAGC TTCATTAAGT TTAACAAGTT CGATTCAAAC AATGACTGGA TATATTGTTG 4 74 0 

AGATAGCGAC AGGTGATGCA ACATTTGGAT CAAATATTTA TTACAGTATT TATGCTGTAG 4 800 

GGTTCACACT ATTTATCTTT ACCTTAATCA TGAATTTACT TTCTCAGTGG ATTTCTAAGC 4 860 

GTTTTAGGGA GGAGTATTAA TATGGAAACG ACAGATAATA ATAGACAATC ACTCGTCGAT 4 920 

CAACAACTTG TCCAAAAACA TTTATCATCC AGAACGGTTA AAAATAAAGT GTTCAAACTC 4 980 

ATATTTTTAG CATGTACATT ATTAGGACTT GTCGTACTTA TTGCGTTGTT AACTCAAACA 504 0 

TTGATTAAAG GGGTAAGTCA TTTAAATTTA CAGTTTTTCA CTAATTTTTC TTCTTCAACA 510 0 

CCATCTATGG CTGGCGTTAA AGGCGCGTTA ATCGGTTCAC TTTGGTTAAT GTTAAGTATC 516 0 

ATTCCATTAT CAATCATCCT AGGAATAGGT ACAGCTATAT ACTTAGAAGA ATATGCGAAA 522 0 

AACAACAAAT TTACTCAGTT TGTTAAAATC AGTATTTCCA ATTTAGCTGG TGTACCATCA 5 28 0 

GTTGTATTTG GGTTATTAGG TTATACTTTG TTCGTTGGTG GTGCAGGGAT TGAAGCCTTG 5 34 0 

AAAATGGGTA ACAGTATATT GGCAGCAGCG CTAACAATGA CCTTACTGAT ATTACCAATT 54 00 

ATTATTG TTT CAAGTCAGGA AGCAATTAGA GCTGTACCTA ACTCAGTACG CGAACTTcTT 54 6 0 

ACGGCTTAGG TGCTAATAAA TGGCAAACGA TAAGACGTGT TGTCTTACCA GCAGCGTTAC 5 520 

CTGGTATTTT AACTGGATTC ATTTTGTCTC TTTCAAGAGC ACTGGGAGAA ACAGCGCCAC 5 58 0 

TTGTGCTAAT CGGTATACCG ACTATATTAT TGGCAACACC TAGAAGTATA TTGGATCAAT 564 0 

TTTCAGCATT ACCTATCCAA ATATTTACTT GGG CGAAAAT GCCTCAAGAA GAATTCCAGA 570 0 

ATGTTGCATC GGCAGGCATT ATCGTTTTAC TAGTTATCTT AATCTTAATG AATGGCGTTG 576 0 

CGATTATTTT ACGTAACAAA TTTAGTAAAA AATTCTAATT TAAACAATCA ATCTCATTTA 5 820 

TCTATTAAAA AGGGAGTTTT AAATATGGCG CAAACACTTG CACAAACTAA ACAAATATCT 5 880 

CAAAGTCATA CGTTTGATGT CTCACAAAGT CATCATAAAA CACCAGATGA TACAAACTCA 5 94 0 

CATTCTGTTA TATATT CAAC ACAAAATTTA GACTTATGGT ATGGCGAAAA TCATGCATTA 6 00 0 

CAAAATATTA ATTTAGATAT TTATGAAAAC CAAATTACTG CCATTATAGG TCCATCTGGT 6 06 0 
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AAAACAGCTG GTAAAATATT ATATCGAGAT CAAGACATTT TTGATCAAAA ATATTCTAAA 6180 

GAACAA1TAC GTACAAATGT GGGCATGGTC TTTCAACAAC CTAATCCATT TCCAAAATCA 624 0 

5 ATATACGATA ATATTACTTA CGGTCCAAAG ATTCACGGTA TTAAAAATAA AAAAGTTCTT 6 3 00 

GATGAAATCG TTGAGAAATC ATTACGTGGC GCTGCAATTT GGGATGAATT AAAGGATAGG 63 60 

TtGCACACAA ATGCATATAG TTTATCCGGT GGGCAACAAC AACGTGTTTG TATCGCGCGT 64 20 

>° TGTTTAGCAA TTGAACCTGA AGTCATTTTA ATGGATGAAC CGACATCAGC ATTAGATCCA 64 80 

ATCTCAACAT TAAGAGTAGA AGAGTTGGTT CAAGAACTAA AAGAAAAGTA TACAATTATT 6 54 0 

ATGGTtACAC ATAATATGCA ACAAGCAGCT CGTGTATCAG ATAAAACTGC ATTTTTCTTA 6 600 

15 

AATGGTTATG TCAATGAATA TGATGATACT GATAAAATTT TCTCTAACCC ATCAAACAAG 6 660 

AAAACAGAAG ATTATATTTC AGGAAGGTTT GGTTGATATA TAATGGCAAT AATTAGACAA 6 72 0 

zo CGATATCAGG AG CAACTTGA TGATTTAATA AAAGAATTAC GTCGGTTAGG TGCaAATGTC 6 7 80 

TATGTGAGTA TTGaAAATGG TATAAAAtCA TTAAGTATTG a CGATAGAGG cTTTGCACGA 6 84 0 

CAAACAGTTA AAAACGATAA ACATATCAAT CAATTAAATT ATGATATTAA TGAGCGAGTT 6 900 

25 ATCATGTTAA TTACAAAGCA ACAGCCCATT GCGAGTGATT TGCGTATGAT GATTTCTTCA 6 96 0 

TTAAAAATCG CCTCCGATTT AGAAAGAATA GGAGATAATG CCTCGAGTAT TGCCAATATT 7 020 

CGATTGCGTA CAAAGATTAC AGATGATTAT GTGTTAACCC GTTTAAAGAC AATGGGTAAA 7 0 80 

30 TTAGCTATGT TAATGTTAAA GGACTTAGAT CAAGCATTTA AAAAGAAAGA TACCGTATTA 714 0 

ATAAGAGAAA TAATTGAGCG TGATGAAGAT ATCGATGACT TATATAGTCA TATTATTAAC 72 0 0 

GCAACGTATC TTATTGATAA CGt CCATTTG TCGCTGCACA AG CTCATTT A GCAGCAAGAC 72 6 0 

35 ATTTAGAACG TATTGGTGAT CATATTATTA ACATCGCTGA AAGTGTTTAT TTTTATTTAA 73 20 

CAGGTACACA TTACGAACAA TAACTTAAAG TTATTACTAT AAAATCCCTT ACGATAAATA 73 8 0 

TATATTTCTA TTATTCATAA ACCCTCAAAA AAACCAAGAT TCTCACAATT AGTAATGTGA 74 4 0 

AAATCTTGGT TTATATTGTT CTACTATAAA TTGTCTCGCA TCTTAGTTAT TTGCTTGCTC 75 0 0 

AATTTCATCT GTTAATTTTT CAACTTCATC GACTAAATCA GAAATATATT GAATTGTAGA 75 6 0 

4s TTTAAGTGGC TGTTCTGTAG TAATGT CTAC ACCTGCAATG TTTGCAAGTT CGACAGGTGA 7620 

TACACTACCA CCTTTTTTCA ATGTTT CTAA CCAAGCATCA ACAGCTGGTT GGCCTTCATT 76 BO 

TTTAATCTTT TGAGAAACGA CAGTTCCGAT TGTTAAGCCA GCAGAATACG TATACGAATA 7 74 0 

SO TAATC C CAT A TAGTAATGAG GTTGACG CAT CCATGTTAAT TCAGCACCCT CAGTCATGTC 78 00 

TACTGCATCT CCAAAAAATT GTTTATAAAC ATTTAGCATT ATTTCATTTA ATGTnCGGCG 7 86 0 

55 
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(2) INFORMATION FOR SEQ ID NO: 162: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 162: 
TTTTTTCTTT TCTTCATTTG AAAATTGATC ATTCAGCAAT ATAAGCGTAT TTGTTAATGA 6 0 

TTTAGGTGTT CCAATTTCAT AATCCCACCA ATTTAAGTTG GTATTCTTGC CAGTTGTTTT 12 0 

15 

AGTAAAATTC TCACTTAATT CTTTTACTTT TTTATCTGGT TCTTTT CCAT ATGCATTTTT 180 

ATGCAGCCAC TCAAGGGCAT CTTTCACTTT CTTCTTATTT TCGTCAGTAT TTAAAGTGGT 24 0 

20 TTTAGGATTC CTCATCGCTT CTGCGATTTT CTCAATATTA CGATAGGTAC GAGTCATATG 3 00 

AGAAGAATTA GTTTCAAGGG TTTCCGCTCC TGACCACAAG TATTTCCTAC CACTTTCAGT 3 60 

TTTCATTTCC TTGAGTAAAT TCGTCGCCTC TTTCTCTGTA GCATCAAACT TCTTCTTCAT 420 

25 ATCTGGATTA TTCTCATCAT ACTTATCATA ACCATAGTTA ACGTCCAGCC ATGTGTTCCT 480 

CAATTTTTCA TAATCTGGCG TTTGAACATT CGTATCAGCC ACAGCGATTT GATGTTTATC 540 

AACACTTCTG AATTCACCAC CATTCAAAGT AATCACACCA GCCATTAATA ACGTAATGGT 600 

30 GGATAATTTT TGCCATTTCT TTATTCTATA TGTCATTGaC ATGTCTCCTT TTTGTGTTGC 6 60 

GCGTGCGCAA TGAATATTAT GATTAAATAA TGATTCAATT TTTCAAAATT CGTTAACGTA 720 

TACAAATGAC TGTCTACTGT CAAACAATCC ACAAAGAATG TTGATG t CAT ATaAACAATC 7 80 

GATCACCCAA ATTTTCCG 798 



(2) INFORMATION FOR SEQ ID NO: 163: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH : 5132 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 163: 
TACAGGTTTT ACTATAATGG ATGGTATTTT GG CTAAACGA CATTGGTTTA GTCTT CTTTT 6 0 

50 TTTnACTTCC TAnATTTACA ATGGTATAAA TAATAATGCT ATATTTAGAA TGATGAGTAT 120 
ACTTACTGAA ACTAAATTAA AAGTGTCTGG TTCTTTACTA AAGATAGCTG CTATCCTTGC 180 

55 
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AATACAAGTT CCAATGAGCG CAATTAAAAG TACTAACCCA ACGATGAAAC TCTGTTTGTC 3 00 

ACTTAACTCA AAGAAACTAT AGATAGGATA TTTTTTAATA ATCAAGC CAC CTAAAATCAT 3 60 

CCATAAAAAT ACGATAATTC CATAAGTCAC ATTTATAACA TACGTTATTT TTTGGTCACC 42 0 

AAATCGGACT AATGTATTTC GTAGAATCAG CATACCAATG ACAACACCTA AAATAACGAT 4 80 

ACTAGCTATA TAAAGTAAAA ATGCAATTGT CACATCAAAT GTACCCAAAT CTAAAAACCT 54 0 

AGGAATTAyA AyGACTGCTA AAATAAAAGC GAAGyACAAA GTAATATAkT TATACAAACC 600 

GGTAGTAAGA CTTATCTCAG GTGATAATTG ATCAGCCATT GACTTAATCG GTGTATTAAT 660 

AATTGAACTT GTATCTTCGT TATT TT TTTC AGCCATAGTT AAATGATCTT CGAGCTCTTC 72 0 

CAATAACTCT TCTACTTCTG CTTCAGTCTT ACCTCTAAAT AACAATTCAA CACGTAATTT 78 0 

TTCTAAAAAA TCTTGAGATT GTTTACTTAA CATCGTTTTC CCCTCCAAAC AAGTTAATCA 84 0 

TCCCTTTATT CAAAACTTGC CATTTCGATT TAAATACTTT TAGTTCCTTT AAACCTGAAT 900 

CGGTAATCGT ATAGTATTTC CGCCTCGGGC CGCCATTACT AGATTTTTTT ATTGTCGTAT 960 

CAACGTATCC TT TTT T GTTT AAACGCATTA AAACTGGATA AATACTACCC TCACTTATCT 1020 

CTGGAAACTC TTGATTCTTA AGTTTCGTCA TAATTTCATA TCCATACGTT TCGCCTTGGG 108 0 

CAATGAGACC TAATATCGCC CCATCTAAGA GACCTTTCAT AATCTGATCT GACACTGACA 114 0 

TTTTAATCAC CTACTATCTT ACATAATAAG ATAGTACATT GAGAACTTTT CGTCAACTAT 1200 

CTTTTATTGT AAGGTAGTTG TTGTACACAT TCCTTAAATG ACTAACAACT TTGTTAATAG 1260 

GGTAATACTT ACGGAAG TAT ATTTTATTTA TGGGGGAGGA ATTAATAATG ACTACAAAAA 132 0 

CAGTATTTGA TGTCATTGAT ATGGGGTTAG GATATTTAGT AAATGTGTAT GATGCTTGGA 1380 

AAGTTGAAAA GGTACTTGAT GATTATCATA AGCCTTTTTC TAATACCATT CATTGGCAAT 144 0 

TTGGfcCATGT ATTAACAATT TTTGAATCGG CCTTAGCTGT TGCTGGTAAA GAGAATATTG 1500 

ATTTAAATAT CTATAGACCT TTATTCGGAA ATGGTTCGTC TCCAGATGAA TGGAAGGATG 156 0 

AAGTACCGAG TATTGAAAGG ATTTTAGAAG GTCTCCAAAC TTTACCTGAA CGTGCACGAA 162 0 

ATCTAACTGA AGATGATTTA GCAATTGAAT TGAAACAGCC AATTGTCGGT TGTAATAACT 1680 

TAGAAGAGTT ATTAGTATTA AATGCCATTC ACATCCCACT TCATGCTGGT AAAATTGAAG 1740 

AGATGTCTCG TATATTAAAA AATTTAAAAT AAATATGTGC TTATTAACCG TTAACAACAC 1800 

GTTAACGGgT TTTTTATTTG TTTAAAAGGT CACTTTTTTG AATTTAATAA ACACCATCTA 186 0 

TACCAGTTCT TCACCGATTC TCGAAAAATA ATTATATTAA TGATTTCGTT AATTTAATTT 1920 

TATATTTAAT TATTACTGTA CATCTTTTGT AGTTAGCTTT ATTCTTAAAT TGAAATATGT 1980 
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TACTCCCTAT CGTTGTAGGT CTCCTTATTT GGGCACTTAC ACCTTTTAAA CCGGATGCTG 210O 

TGGATCCAAC AGCATGGTAT ATGTTCGCAA TATTCGTCGC GACAATCATT GCTTGTATTA 2160 

CACAACCGAT GCCAATTGGG GCCGTCTCTA TAATTGGATT TACAATCATG GTACTCG TTG 222 0 

GCATTGTTGA CATGAAAACG GCTGTCGCTG GTTT TGGTAA TAAT AG CATT TGGTTAATTG 22 8 0 

CTATGGCATT TTTCATTTCG AGAGGATTTG TGAAAACAGG TCTTGGTAGA CGTATCGCAC 234 0 

TTCATTTCGT CAAATTATTT GGTAAAAAAA CATTAGGATT AGCATATTCT ATCGTCGGTG 24 0 0 

TAGATTTAAT TCTAGCGCCT GCTACACCAA GTAATAC CGC GCGTGCTGGT GGAATCATGT 24 6 0 

TCC CAATTAT CAAATCACTT T CTGAAT CAT TTGGTT CGAA ACCGAAAGAC GGATCAG CAC 252 0 

GCAAAATGGG TGCATTTCTT GTTTTCACAG AATTCCAAGG TAATTTAATT ACTGCGGCTA 25 80 

TGTTTTTAAC TGCAATGGCC GGTAACCCCC TTGCACAAAA TTTAGCATCT AGCACATCTA 264 0 

ATGTTCACAT TACATGGATG AATTGGTTTC TAGCTGCTTT AGTTCCTGGA CTTGTTT CCT 27 0 0 

TAATTGTTGT ACCTTTTATT ATTTATAAAA TTTATCCACC AACTGTTAAA GAAACACCAA 2760 

ATGCTAAGAG TTGGGCTGAA AATGAATTAG CGACTATGGG TAAAATCGCT TTAGCTGAAA 2820 

AATTTATGAT TGGTATTTTT GTCGTTGCGT TAACACTATG GATTGTCGGA AGTTTCATTC 2 88 0 

ATATTGATGC AACTTTAACG GCCTTTATTG CGCTAg CATT g TTATTATTG ACAGGCGTCT 2 94 0 

TAACATGGCA AGACATTTTA AACGAAACAG GTGCTTGGAA CACATTAGTA TGGTTCTCAG 3000 

TATTAGTGTT AATGGCCGAC CAATTAAACA AGCTTGGATT TATTCCTTGG TTAAGTAAAT 306 0 

CCATTGCTAC AAGTCTTGGT GGCTTAAGCT GGCCTATAGT CCTGGTCATT TTAATATTGT 312 0 

TCTACTTCTA TTCACATTAC TTATTTGCAA GTTCTACAGC ACATATCAGT GCGATGTATG 3180 

CAGCATTACT AGgCGTTGCC ATCGCAGCCG GTGCACCACC ATTATT CAGT GCATTAATGT 32 4 0 

TAGGTTTCTT CGGTAACCTA TTAGCTTCAA CAACACACTA TAG TAGTGGT CCAGCGCCGA 330 0 

TTCTATTCTC TTCAGGTTAC GTGACTCAAA AACGTTGGTG GACAATGAAC TTAATATTAG 3360 

GTTTCGTCTA CTTTATTATC TGGATTGGTT TAGGATCACT TTGGATGAAA GTAATTGGTA 342 0 

TATTTTAAAA TATTTAAATT AGCGCTCGAA TCTCATTGAT TTGGGCGCTT TTTAATTTGT 34 8 0 

ATTTAAAATC AACCTTTGCT AAATCAAGAC TCC CTTTTTA AAATACGTTT ATCCTTTAAA 3 54 0 

TCATTGCGTG CTTCACTGAA AATTTGTATA AAGATTTAAG TCATTACGTA ACATCACATA 3600 

AAATACATTT CTATACTATT CCGCTTCATT GATTAACATT ACGTATGCCC TCATAAATCA 3660 

TCATACAAAA AACACCTTCG TTTAAATTCA TTTTAATTGC GAATTCAACG AAAGTGCCTT 3720 

ATTTCATATT TAATGTTTCA AATTTATACG TCTGTCACTG TTACTG CACA CATACCTCAG 37 8 0 
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TTATAGGGTT TTTGCGACCG GATGTTTCTT CAATTTAATG TATTGAGAAA GACTATATAA 3 90 0 

CACAATACCT G TC CAAATAA ATATAAACGT AATTAATTGA TCTATACTAA AAGGCTCTTT 3 96 0 

5 GAAAACAAAT ATGCCGAGTA CAAACATTAT TGTTGGTCCA ACGTATTGAA TAAATCCTAT 4 02 0 

TAGCGAAAGT GGAATACGTT TTGCCCCGGC TGAGAATAGG ATTAGTGGTA TTGCCGTAAT 4080 

AGCACCAGAA AATAACAACC AAAATGATGA CATGTTCAAT CCAAATGACA TCTGATGTTG 414 0 

10 

CTGCCATAAA TAAATAACGT ATATTAGTCC AGCAGGTGCG GTAACAATAC ATTCAATCGT 42 0 0 

AATACTGCTG ATGGCATCAA TATGTACTAC TTTTTTCAAT AATCCGTATG TACCAAAGGA 42 6 0 

TAACGCTAAT ATAATAGAGA CGATTGGGAA TTCTCCAATC TTGAGCGTCA TATATAATAC 43 2 0 

ACCGATGAAT GCGAATAAAA TGGCTAGCCA TTCAAATTTA TTGAATCTTT CTTTTAAAAA 43 80 

GATAAGTGCG AG CAAAATG C TAACAAGTGG ATTTATATAA TAACCTAAAC TTGTTTGTAG 444 0 

20 GACGTGACCG TT CGTTACAG CCCAAATAAA TGTACCCCAA TTTAATGTAA TGACATAGCC 4 50 0 

TGCTACGACA ATCGCTAATA GCTGAATGGG CTTGCCTAAC AATTGATTCA TATCTCGTTG 4 560 

AAATGCATTG CGTTGTTTTT GTCCAACCGC GAGTATGAAA ATCATGAATA TTGCTGAAAA 4 62 0 

25 TATAATACGA AAGGCTAAAA TTTCAAATGC GCCTATTGCA TCAACGAACT GCCAATATAT 4 68 0 

AGGTAGTATT CCCCACAGAA TGTATGCACT GAGTGCTAAA AATATGCCTT TTTTATACTC 4 74 0 

TGAATTCACC TTCAAACCTC CTTACTTTCC TAATTTTTAA TTTACTGCAT ACGCTCACTT 4 8 00 

30 GGTTATGCTA ATATAACGAT TTTACTAATA ATATTTCGAT AAAGATATCA TTTTGTTTAT 4 860 

ATTTCCCACA TTTATTCACC AACCACTAAA CAATATTAAT TTTATAAATA ATTCTGTACA 4 920 

AATCAGGGTA TATTGCCAGA AAGACTACCA TACAACATAA AGGATGGATA CAAATGACTT 4 980 

35 

TACCTAAAAT TGGAAAG CCT GCAACACGCG CGCTAAATTC ACAAGGTATA TACACATTAG 5040 

AAGCAGTATC ACAATATACG AAGTCATCTC TAATGGAGAT GCATGGCGTT GGTCCTAAAG 510 0 

CTATATCAAT ATTGGAACAA GCTTTATTTC AG 5132 

40 

(2) INFORMATION FOR SEQ ID NO: 164: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 22243 base pairs 
4S (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

SO (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 164: 

AAGTAAATTA TATTATGAAT TTGCCTGTCA ATTTCTTAAA GACATTCTTA CCGGAACTAA 6 0 
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TAGAAGCAAT TAATAATGCy mAAGAAAAGA CAGCTAATAA TACCGGCTTA AAATTAATAT 180 

TTGCAATTAA TTATGGTGGC AGAGCAGAAC TTGTTCATAG TATTAAAAAT ATGTTTGACG 24 0 

AGCTT CATCA ACAAGGTTTA AATAGTGATA TCATAGATGA AACATATATA AACAATCATT 3 00 

TAATGACAAA AGACTATCCT GATCCAGAGT TGTTAATTCG TACTTCAGGA GAACAAAGAA 36 0 

TAAGTAATTT CTTGATTTGG CAAGTTTCGT ATAGTGAATT TATCTTTAAT CAAAAATTAT 42 0 

GGCCTGACTT TGACGAAGAT GAATTAATTA AATGTATAAA AATTTATCAG T CACGTCAAA 4 80 

GACGCTTTGG CGGATTGAGT GAGGAGTAGT ATAGTATGAA AGTTAGAACG CTGACAGCTA 54 0 

TTATTGCCTT AATCGTATTC TTGCCTATCT TGTTAAAAGG CGGCCTTGTG TTAATGATAT S00 

TTGCTAATAT ATTAGCATTG ATTGCATTAA AAGAATTGTT GAATATGAAT ATGATTAAAT 66 0 

TTGTTTCAGT TCCTGGTTTA ATTAGTG CAG TTGGTCTTAT CATCATTATG TTGCCACAAC 720 

ATGCAGGGCC ATGGGTACAA GTAATTCAAT TAAAAAGTTT AATTGCAATG AGCTTTATTG 780 

TATTAAGTTA TACTGTCTTA TCTAAAAACA GATTTAGTTT TATGGATGCT GCATTTTGCT 84 0 

TAATGTCTGT GGCTTATGTA GGCATTGGTT TTATGTTCTT TTATGAAACG AGATCAGAAG 90 0 

GATTACATTA CATATTATAT GCCTTTTTAA TTGTTTGGCT TACAGATACA GGGGCTTACT 96 0 

TGTTTGGTAA AATGATGGGT AAACATAAGC TTTGGCCAGT AATAAGTCCG AATAAAACAA 1020 

TCGAAGGATT CATAGGTGGC TTGTTCTGTA GTTTGATAGT ACCACTTGCA ATGTTATATT 10 80 

TTGTAGATTT CAATATGAAT GTATGGATAT TACTTGGAGT GACATTGATT TTAAGTTTAT 114 0 

TTGGTCAATT AGGTGATTTA GTGGAAT CAG GATTTAAGCG TCATTTCGGC GTTAAAGACT 1200 

CAGGTCGAAT ACTACCTGGA CACGGTGGTA TTTTAGACCG ATTTGACAGC TTTATGTTTG 1260 

TGTTACCATT ATTAAATATT TTATTAATAC AATCTTAATG CTGAGAACAA ATCAATAAAC 13 20 

GTAAAGAGGA GTTGCTGAGA TAATTTAATG AATCTCAGAA CTCCTTTTGA AAATTATACG 13 8 0 

CAATATTAAC TTTGAAAATT ATACGCAATA TTAACTTTGA AAATTAGACG TTATATTTTG 144 0 

TGATTTGTCA GTATCATATT ATAATGACTT ATGTTACGTA TACAGCAATC ATTTTTAAAA 15 0 0 

TAAAAGAAAT TTATAAACAA TCGAGGTGTA GCGAGTGAGC TATTTAGTTA CAATAATTGC 1560 

ATTTATTATT GTTTTTGGTG TACTAGTAAC TGTTCATGAA TATGGCCATA TGTTTTTTGC 16 20 

GAAAAGAGCA GGCATTATGT GTCCAGAATT TGCGATCGGT ATGGGGCCAA AAATTTTTAG 16 80 

TTTTAGAAAA AATGAAACAC TTTACACTAT TAGGTTATTG CCTGTTGGTG GATATGTTCG 174 0 

TATGGCAGGA GATGGCTTAG AAGAGCCACC AGTCGAGCCC GGTATGAACG TTAAAATTAA 1800 

ACTTAATGAA GAAAATGAAA TAACACATAT CATATTAGAT GATCATCATA AGTTTCAACA 1860 
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CACTGCTTAT GATAATGAAA GACATCATTT TAAAATTGCT AGAAAGTCTT TCTTTGTTGA 1980 

AAATGGTAGC TTAGTTCAAA TTGCTCCGAG AGACAGACAA TTTGCACATA AAAAGCCATG 2 04 0 

5 GCCGAAATTT TTAACATTAT TTGCGGGACC GTTATTTAAC TTTATATTAG CTTTAGTCCT 2100 

ATTTATTGGT CTTGCATATT ATCaAGGcAC GCcTACGTCT ACTGTAGAAC AAGTCGCAGA 21 GO 

TAAGTATCCA GCTCAACAAG CAGGATTACA AAAAGGTGAT AAGATCGTCC AAATTGG CAA 2220 

ATATAAAATA TCTGAATTTG ATGATGTTGA TAAGGCGTTA GATAAAGTTA AAGATAATAA 2 2 80 

GACGACTGTT AAATTTGAAC GTGATGGTAA AACAAAGTCA GTTGAATTAA CACCTAAAAA 234 0 

GACTGAAAAA AAACTGACTA AAGTAAGTTC AGAGACGAAG TATGTTCTCG GATTCCAACC 24 00 

15 

AGCGAGTGAA CATACACTTT TTAAACCAAT TGTATTCGGA TTTAAAAGCT TTTTAATCGG 24 60 

TAGTACTTAT ATTTTTACAG CTGTAGTAGG TATGTTGGCT AGTATATTTA CGGGCGGATT 2520 

20 CTCATTTGAT ATGTTAAATG GTCCGGTTGG TATTTATCAT AACGTCGACT CAGTTGTTAA 25 80 

AGCGGGTATC ATTAGCTTAA TTGGTtnCAC TGCGTTATTA AGTGTAAACT TAGGTATTAT 264 0 

GAATTTAATT CCTATTCCTG CACTAGACGG TGGTCGTATT TTATTTGTTA TATATGAAGC 2 700 

25 GATTTTCAGA AAACCAGTTA ATAAAAAAGC GGAAACAACG ATTATTGCTA TTGGTGCCAT 276 0 

TTTCATGGTC GTTATAATGA TATTAGTAAC GTGGAATGAT ATTCGACGAT ATTTCTTATA 2 820 

ATTTAGGAGG ATAAATAATT ATGAAGCAAT CCAAAGTTTT TATACCAACG ATGCGTGACG 2 880 

30 TGCCATCAGA AG CAGAAGCA CAAAGTCATC GTTTATTATT GAAATCGGGT TTGATAAAAC 2940 

AAAGTACAAG TGGGATTTAT AGTTATTTAC CGCTAGCAAC ACGTGTGTTA AATAATATTA 3000 

CTGCAATTGT GCGACAAGAA ATGGAACGTA TCGATTCTGT TGAAATTTTA ATGCCAGCGT 3 06 0 

35 

TACAACAAGC TGAATTATGG GAAGAATCAG GACGTTGGGG TGCATATGGC CCAGAATTAA 312 0 

TGCGTTTACA AGATAGaCAT GGAAgACAAT TTgCATTAGG TCCaACACAT GAAGAATTAG 318 0 

TTACATCAAT AGTAAGAAAT GAATTGAAAT CATACAAACA ATTACCGATG ACATTATTCC 3240 

40 

aAATTCAATC TAAATTCCGT GATGAAAAGA GACCACGTTT TGGTTTAyTC GTGGGCGTGA 33 00 

ATTTATTATG AAAGATGCAT ATTCATTCCA TGCTGACGAG GCATCATTAG ATCAAACGTA 33 60 

45 TCAAGATATG TATCAAGCGT ATAGC CGTAT TTTTGAGAGA GTTGG CATTA ACGCAAGACC 34 2 0 

AGTAGTTGCA GATTCAGGTG CTATAGGCGG TAGCCATaCA CATGAATTTA TGGCATTAAG 34 80 

TGCTATCGGT GAGGATACAA TCGTTTACAG TAAAGAAAGT GATTATGCTG CTAACATCGA 3 540 

50 AAAAGCAGAA GTCGTTTACG ArcCAaATcA TaAGCATACT ACTGTGCAAC CTTTAGAAAA 3600 

AATTGAAACA CCAAATGTTA AGACTGCGCA AGAATTGGCA GACTTCTTAG GTAGACCAGT 3660 
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GCGTGGCCAT CATGAAATTA ATGACATTAA ATTAAAATCT TATTTCGGCA CAGATAATAT 37 8 0 

TGAATTAGCA ACACAAGACG AAATTGTTAA TTTAGTTGGT GCAAATCCTG GTTCACTAGG 3 84 0 

TCCTGTAATT GATAAAGAAA TCAAAATTTA TGCAGATAAT TTTGTGCAAG ATTTAAATAA 3900 

TTTAGTTGTC GGTGCTAACG AAGATGGTTA TCACTTAATT AATGTAAATG TAGGTAGAGA 3 96 0 

CTTCAACGTT GATGAATATG GCGATTTCCG TTTTATTTTA GAAGGCGAAA AGTTAAGTGA 4 02 0 

TGGTTCAGGC GTTG CACATT TTGCTGAAGG TATTGAAGTT GGTCAAGTAT TCAAATTGGG 4 08 0 

TACTAAGTAT TCAGAATCAA TGAATGCTAC ATTCTTAGAT AACCAAGGAA AAGCTCAATC 414 0 

TTTAATTATG GGTTGTTACG GAATTGGAAT TTCTAGAACG CTAAGTGCGA TTGTTGAACA 420 0 

AAATCACGAT GATAATGGAA TTGTTTGGCC TAAATCAGTT ACTCCGTTTG ATTTACATTT 4260 

AATTTCTATT AATCCTAAGA AAGATGATCA ACGAGAACTA GCAGATGCAC TATATGCTGA 4 3 20 

ATTTAATACT AAATTTGATG TGTTGTACGA TGATCGTCAG GAACGTGCAG GTGTTAAATT 43 80 

TAATGATGCC GATTTAATTG GTTTACCACT GCGAATTGTT GTTGGTAAAC GTGCATCGGA 44 4 0 

AGGTATTGTA GAAGTTAAAG AACGTTTAAC AGGTGATAGC GAAGAAGTTC ACATTGATGA 4500 

CTTAATGACT GTCATTACAA ATAAATATGA TAACTTAAAA TAATTAAGAT CGAATGAATT 456 0 

ATAAGAGTAG GAAAAAGCTG AAAGAAATCT GATGCTTATG TCCTGCTCTT ATTATTTTTG 4 620 

ATATAATGAT TATTCGATGA AAAATGACTG AAGACATAGT ATAATTAAAG ATAAATTTGT 46 8 0 

TTTAACAATA TAATGATTAG CCAAATATAA AGCATTTAAT TTTCTATCAT TACTATGCTC 474 0 

ACATAATCTA AATATTGTTC GAACACGTAA AAGTAATTTC TATTTAAGGT GGTAATTGTC 4 800 

TTGGCAATGA CAGAGCAACA AAAATTTAAA GTGCTTGCTG ATCAAATTAA AATTTCAAAT 4860 

CAATTAGATG CTGAAATTTT AAATTCAGGT GAACTGACAC GTATAGATGT TTCTAACAAA 4920 

AACAGAACAT GGGAATTTCA TATTACATTA CCACAATTCT TAGCTCATGA AGATTATTTA 4 980 

TTATTTATAA ATGCAATAGA GCAAGAGTTT AAAGATATCG CCAACGTTAC ATGTCGTTTT 504 0 

ACGGTAACAA ATGGCACGAA TCAAGATGAA CATGCAATTA AATACTTTGG GCACTGTATT 5100 

GACCAAACAG CTTTATCTCC AAAAGTTAAA GGTCAATTGA AACAGAAAAA GCTTATTATG 5160 

TCTGGAAAAG TATTAAAAGT AATGGTATCA AATGACATTG AACGTAATCA TTTTGATAAG 5220 

GCATGTAATG GAAGTCTTAT CAAAGCGTTT AGAAATTGTG GTTTTGATAT CGATAAAATC 5280 

ATATTCGAAA CAAATGATAA TGATCAAGAA CAAAACTTAG CTTCTTTAGA AgCACaTATT 534 0 

CAAGAAGAAG ACGAACAAAG TGCACGATTG GCAACAGAGA AACTTGAAAA AATGAAAGCT 54 00 

GAAAAAGCGA AACAACAAGA TAACAACGAA AGTGCTGTCG ATAAGTGTCA AATTGGTAAG 54 60 
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GCAATAGAGG GTGTCATTTT TGATATAAAC TTAAAAGAAC TTAAAAGTGG TCGCCATATC 5 580 

GTAGAAATTA AAGTGACTGA CTATACGGAC TCTTTAGTTT TAAAAATGTT TACT CGTAAA 564 0 

5 AACAAAGATG ATTTAGAACA TTTTAAAGCG CTAAGTGTTG GTAAATGGGT TAGGGCTCAA 570 0 

GGTCGTATTG AAGAAGATAC ATTTATTAGA GATTTAGTTA TGATGATGTC TGATATTGAA 57 6 0 

GAGATTAAAA AAGCGACAAA AAAAGATAAG GCTGAAGAAA AGCGTGTAGA ATTCCACTTG 582 0 

10 

CATACTGCAA TGAGCCAAAT GGATGGTATA CCCAATATTG GTGCGTATGT TAAACAGGCA 588 0 

GCAGACTGGG GACATCCAGC CATTGCGGTT ACAGACCATA ATGTTGTGCA AGCATTTCCA 594 0 

GATGCTCACG CAGCAGCGGA AAAACATGGC ATTAAAATGA TATACGGTAT GGAAGGTATG 600 0 

15 

TTAGTTGATG ATGGTGTTCC GATTGCATAC AAACCACAAG ATGTCGTATT AAAAGATGCT 6060 

ACTTATGTTG TGTTCGACGT TGAGACAACT GGTTTATCAA ATCAGTATGA TAAAATCATC 6120 

2Q GAGCTTGCAG CTGTGAAAGT TCATAACGGT GAAATCATCG ATAAGTTTGA AAGGTTTAGT 618 0 

AATCCGCATG AACGATTATC GGAAACGATT ATCAATTTGA CGCATATTAC TGATGATATG 624 0 

TTAGTAGATG CCCCTGAGAT TGAAGAAGTA CTTACAGAGT TTAAAGAATG GGTTGGCGAT 63 0 0 

25 GCGATATTCG TAGCGCATAA TGCTTCGTTT GATATGGGCT TCATCGATAC GGGATATGAA 63 6 0 

CGTCTTGGGT TTGGACCATC AACGAATGGT GTTATCGATA CTTTAGAATT ATCTCGTACG 642 0 

ATTAATACTG AATATGGTAA ACATGGTTTG AATTTCTTGG CTAAAAAATA TGGCGTAGAA 64 8 0 

30 TTAACGCAAC ATCACCGTGC CATTTATGAT ACAGAAGCAA CAGCTTACAT TTTCATAAAA 654 0 

ATGGTTCAAC AAATGAAAGA ATTAGGCGTA TTAAATCATA ACGAAATCAA CAAAAAACTC 6600 

AGTAATGAAG ATGCATATAA ACGTGCAAGA CCTAGTCATG TCACATTAAT TGTACAAAAC 66 6 0 

35 CAACAAGGTC TTAAAAATCT ATTTAAAATT GTAAGTGCAT CATTGGTGAA GTATTTCTAC 672 0 

CGTAGACCTC GAATTCCACG TTCATTGTTA GATGAATATC GTGAGGGATT ATTGGTAGGT 6780 

ACAGCGTGTG ATGAAGG TG A ATTATTTACG GCAGTTATGC AGAAGGACCA GAGTCAAGTT 684 0 

GAAAAAATTG CCAAATATTA TGATTTTATT GAAATTCAAC CACCGGCACT TTATCAAGAT 6900 

TTAATTGATA GAGAGCTTAT TAGAGATACT GAAACATTAC ATGAAATTTA TCAACGTTTA 6960 

ATACATGCAG GTGACACAGC GGGTATACCT GTTATTG CGA CAGGAAATGC ACACTATTTG 7020 

45 

TTTGAACATG ATGGTATCGC ACGTAAAATT TTAATAGCAT CACAACCCGG CAATCCACTT 708 0 

AATCGCTCAA CTTTACCGGA AGCACATTTT AGAACTACAG ATGAAATGTT AAACGAGTTT 714 0 

50 CATTTTTTAG GTGAAGAAAA AGCGCATGAA ATTGTTGTGA AAAATACAAA CGAATTAGCA 7200 

GATCGAATTG AACGTGTTGT TCCTATTAAA GATGAATTAT ACACACCGCG TATGGAAGGT 7260 
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CTGCCTCAAA TCGTAATTGA TCGATTAGAA AAAGAATTAA AAAGTATTAT CGGTAATGGA 73 BO 

TTTGCGGTAA TTTACTTAAT TTCGCAACGT TTAGTTAAAA AATCATTAGA TGATGGATAC 74 4 0 

5 TTAGTTGGTT CCCGTGGTTC AGTAGGTTCT AGTTTTGTAG CGACAATGAC TGAGATTACT 7 500 

GAAGTAAACC CGTTACCGCC ACACTATATT TGTCCGAACT GTAAAACGAG TGAATTTTTC 756 0 

AATGATGGTT CAGTAGGATC AGGATTTGAT TTACCTGATA AGACGTGTGA AACTTGTGGA 76 2 0 

W 

GCGCCACTTA TTAAAGAAGG ACAAGATATT CCGTTTGAAA CATTTTTAGG ATTTAAGGGA 76 8 0 

GATAAAGTTC CTGATATCGA CTTAAACTTT AGTGGTGAAT ATCAACCGAA TGCCCATAAC 774 0 

^ TACACAAAAG TATTATTTGO TGAGGATAAA GTATTCCGTG CAGGTACAAT TGGTACTGTT 7800 

GCTGAAAAGA CTGCTTTTGG TTATGTTAAA GGTTATTTGA ATGATCAAGG TATCCACAAA 786 0 

AGAGGTGCTG AAATAGATCG ACTCGTTAAA GGATGTACAG GTGTTAAACG TACAACTGGA 7 920 

20 CAGCATCCAG GGGGTATTAT TGTAGTACCT GATTACATGG ATATTTATGA TTTTACGCCG 798 0 

ATACAATATC CTGCCGATGA TCAAAATTCA GCATGGATGA CGACACATTT TGATTTCCAT 804 0 

TCTATTCATG ATAATGTATT AAAACTTGAT ATACTTGGAC ACGATGATCC AACAATGATT 8100 

25 CGTATGCTTC AAGATTTATC AGGAATTGAT CCAAAAACAA TACCTGTAGA TGATAAAGAA 8160 

GTTATGCAGA TATTTAGTAC ACCTGAAAGT TTGGGTGTTA CTGAAGATGA AATTTTATGT 8220 

AAAACAGGTA CATTTGGGGT ACCAGAATTC GGTACAGGAT TCGTGCGTCA AATGTTAGAA 8280 

30 GAT ACAAAG C CAACAACATT TTCTGAATTA GTTCAAATCT CAGGATTATC TCATGGTACA 834 0 

GATGTGTGGT TAGGCAATGC TCAAGAATTA ATTAAAACCG GTATATGTGA TTTATCAAGT 84 0 0 

GTAATTGGTT GTCGTGATGA TATCATGGTT T ATTTAATG T ATGCTGGTTT AGAACCATCA 84 60 

35 

ATGGCTTTTA AAATAATGGA GTCAGTACGT AAAGGTAAAG GTTTAACTGA AGAAATGATT 8520 

GAAAeGATGA AAGAAAATGA AGTGCCAGAT TGGTATTTAG ATTCATGTCT TAAAATTAAG 8580 

TACATGTTCC CTAAAGCCCA TGCAGCAGCA TACGTTTTAA TGGCAGTACG TATCGCATAT 864 0 

40 

TTCAAAGTAC ATCATCCACT TTATTACTAT GCATCTTACT TTACAATTCG TGCGTCAGAC 870 0 

TTTGATTTAA TCACGATGAT TAAAGATAAA ACAAGCATTC GAAATACTGT AAAAGACATG 8760 

TATTCTCGCT ATATGGATCT AGGTAAAAAA GAAAAAGACG TATTAACAGT CTTGGAAATT 8 820 

ATGAATGAAA TGGCGCATCG AGGTTATCGA ATGCAACCGA TTAGTTTAGA AAAGAGTCAG 8880 

GCGTTCGAAT TTATCATTGA AGGCGATACA CTTATTCCGC CGTTCATATC AGTGCCTGGG 8 94 0 

50 CTTGGCGAAA ACGTTGCGAA ACGAATTGTT GAAGCTCGTG ACGATGGCCC ATTTTTATCA 90 00 

AAAGAAGATT TAAACAAAAA AGCTGGATTA TCTCAGAAAA TTATTGAGTA TTTAGATGAG 9060 
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GAAATAATCA 
CTGGACACAA 
TGGTGAAATA 
TCAAGCATAA 
GTGGGAGATT 
AGAACAAGTA 
CGTTGAATAT 
TGGCGTAGAT 
AAATGATCCT 
AATTAAAAAA 
TGTAC CAATT 
AATTGTAGTA 
AATAGCAAAA 
AGTAATGAAT 
GTATTAATTG 
GCAAGAAATG 
AAAGATGTTG 
GTTAAAAACC 
TTTGGTCGTG 
GAACGTGAAA 
ATTGACCGTG 
TCTGAAGCAG 
GTTAACAAAG 
GGTTTATTAA 
GTTAAATCAG 
AATGATATAG 
GTTGAAGAGC 
TTTGTAAAAA 
CAATCTACAG 



AGGTATTTAT 
AATTATGCCC 
AAGGAACAAA 
ACTTATGCTA 
CCCGCTCTTT 
GAAGTGATTG 
GTCAAAGAGG 
TTAAATGATT 
ATTCCTGAAA 
GAACAAGATT 
GAAGGTGAAA 
CAAGTTAAAA 
GCACGTCACG 
TATTATTAGC 
ATGCTATTGA 
TCCGTGTGGA 
TTGAAGAAGT 
CTGCATATGA 
TAGGTGCTCA 
TTTTATTTGA 
TTGACCATCG 
AAAGAAGTCC 
TGGAACAAAC 
AACGTTTATT 
TAGCACGTGA 
ATGCTGTTGG 
TAGGTGGTGA 
ATGCTTTAAG 
TAGTTGTTGT 



TTAATGCGTA 
GTATTTCTTT 
CTTTTACAAG 
TAATTAAGTT 
TCTATTTGCC 
TTAAACCAAT 
G TAG AGATCA 
GTACGCTAGC 
TGTATTATTT 
TCCAAAATGC 
AGGAATGGTT 
TCAAAGCAAG 
CAGTTATGAT 
TACTGAGTAT 
AGCAGCTTTA 
ATTAAATATG 
ATTTGACGAC 
AATTGGTGAT 
AG CAG CG AAA 
AGAATTTATA 
TTATGTATAT 
TAACGAAAAA 
GACAAAAGGT 
TGAACAAGAA 
AGCTGGCGAT 
TGCATGTGTT 
AAAAATCGAC 
CCCTTCTCAA 
TCCTGATTAT 



TGGCGTAGTC AAAGAAATAC 
TCAATGTCTT ACGAGTCTAT 
AATCTCTGAT TAATAGTGAA 
GCTTAAAAAT TAGTGAACTC 
AAAAAGGGAG GCCTGTATGA 
TATGGAAGAC TTGAATTTTG 
TTTTCTTAGA ATCTCTATTG 
TTCTGAAAAA ATAAGT GAAG 
AGACGTAGCG TCACCTGGTG 
AATAACTAAA CCTGTATTTG 
AGGCATTTTA CAAGAAGTCA 
AACGAAAGAT ATAGAGATAC 
TTAACGTGAT GAGGAGGAAA 
TTAGAAAAAG AAAAGAAGAT 
ATTACTG CAT ACAAAAAGAA 
GATCAAGGTA CTTTCAAAGT 
AGAGATGAAG TGGATTTAAG 
ATATACGAAG AAGATGTAAC 
CAAGCAG TAA TGCAACGTCT 
GACAAAGAAG AAGACATACT 
GTGAATTTAG GTCGTATCGA 
TATATTCCTA ACGAACGTAT 
CCTCAAATCT ATGTTTCTCG 
GTTCCAGAAA TTTACGATGG 
CGCTCTAAAA TTAGTGTCTT 
GGTGCTAAAG GCGCACGTGT 
ATCGTTCAAT GGAATGAAGA 
GTTTTAGAAG TTATTGTTGA 
CAATTGTCAT TAGCGATTGG 



AAAATTGTTG 
TCAAATGTAA 
GTCATTTGTT 
AGGCAGAAGA 
GTAAAATTAC 
AACTTGTAGA 
ATAAAGAAGG 
CTATGGATGC 
CAGAACGTCC 
TTTCTTTATA 
ATAATGAAAC 
CGAGAGACAA 
AAACGTGTCA 
TCCTAGAGCA 
TTATGATAGT 
TATCGCTCGT 
TACAGCGCTT 
ACCTAAAGAT 
TCGTGATGCT 
TACTGGAATT 
AGCTGTTTTA 
CAAAGTATAT 
TAGCCATCCA 
TACTGTAATT 
CTCTGAAAAC 
TGAAGCTGTT 
TCCAAAAGTA 
TGAAACAAAT 
TAAAAGAGGA 



9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
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GATGCGCGTG AAGCGGGTAT CTATCCAGTA GTTGAAGCTG AAAAAGTAAC TGAAGAAGAT 109 80 

GTTGCTTTAG AAGATGCTGA CACAACAGAA TCAACCGAAG AGGTAAATGA TGTTTCAGTT 11040 

5 GAAACAAATG TAGAGAAAGA ATCTGAATAA TAGGTTGGAG TGAAGTATCT ATGAAAAAGA 1110 0 

AAAAAATTCC GATGCGAAAA TGTATTCTTT CAAATGAAAT GCATCCCAAA AAAGATATGA 11160 

TTCGTGTTGT TGTTAATAAA GAAGGCGAAA TCTTTGCGGA TGTTACTGGA AAGAAACAAG 11220 

w 

GCCGTGGCGC ATATGTTTCT AAAGATGTTG CTATGGTTGA AAAAGCACAA CAAAAAGAAA 11280 

TTTTAGAAAA ATATTTTAAA GCATCTAAAG AGCAATTGGA TCCTGTTTAC AAAGAAATTA 1134 0 

TTAGATTAAT TTATAGAGAA GAGATCCCAA AATGAGTATA GATCAAATAT TAAACTTTTT 114 00 

AGGATTAGCA ATGAGAGCTG GTAAAGTAAA AACAGGTGAA TCAGTCATTG TTAATGAGAT 114 60 

TAAAAAAGGA AATTTGAAGC TCGTTATTGT TGCAAATGAT GCGTCTGATA ATACAGCTAA 11520 

ATTAATTACA GATAAATGTA AGAGTTACAA AGTTCCATTC AGAAAGTTTG GAAATCGAAA 115 80 

20 

TGAATTGGGA ATAGCACTTG GAAAAGGTGA GCGTGTTAAT GTAGGGATTA CTGACCCAGG 1164 0 

CTTTGCTAAA AAGTTGCTAT CAATGATAGA TGAATATCAT AAGGAGTGAT TATATGAGTA 11700 

2S AACAAAGAAT TTACGAATAT GCGAAAGAAT TAAATCTAAA GAGTAAAGAG ATTATAGATG 11760 

AGTTAAAAAG CATGAATATT GAGGTTTCAA ATCATATGCA AGCTTTGGAA GATGACCAAA 11B20 

TTAAAG C ATT AGATAAAAAG TTCAAAAAAG AACAAAAGAA CGACAATAAA CAAAGCACTC 11880 

30 AAAATAATCA CCAAAAATCA AACAATCAAA ACCAAAATAA AGGGCmACAA AAAGATAACA 11940 

AAAAGAATCm ACAACAAAAT AATAAAGGCA ACAAAGGCAA TAAAAAGAAT AATAGAAATa 12 000 

ATAAGAAAAA TAACAAGAAT AATAAAC CAC AAAATCAACC AGCTGCTCCA AAAGAAATAC 12060 

35 CATCAAAAGT GACATATCAA GAAGGTATTA CAGTAGGCGA ATTTGCGGAT AAATTAAATG 12120 

TTGAATCATC AGAAATTATC AAAAAATTAT TCTTACTTGG TATTGTTGCT AATATCAATC 12180 

AATCATTAAA TCAAGAAACA ATCGAATTAA TTGCCGATGA TTATGGCGTT GAGGTTGAAG 12240 

40 

AAGAAGTTGT GATTAATGAA GAAGACTTAT CAATCTATTT CGAAGACGAA AAAGATGATC 12 3 00 

CAGAGGCAAT TGAGAGACCA GCAGTTGTAA CAATTATGGG ACATGTTGAC CATGGTAAAA 12360 

CGACTTTATT AGATTCAATT CGTCATACAA AAGTTACAGC AGGTGAAGCA GGCGGAATCA 124 20 

45 

CTCAACATAT TGGTGCATAT CAAATTGAAA ACGATGGCAA AAAAATCACT TTCTTAGATA 12480 

CACCGGGACA TGCTGCATTT ACAACGATGC GTGCGCGTGG TGCaCAAGTA ACAGATATTA 12540 

so CTATTTTAGT AGTAGCAGCT GACGATGGTG TTATGCCACA AACAATTGAA GCAATTAACC 12600 

ATGCTAAAGA AGCAgAAGTA CCAATTATTG TTGCAGTAAA TAAAATTGAT AAACCAACTT 12660 
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GCGGCGAAAC AATTtTCGTc 


CACTTTCTGC 


ATTAAGTGGT 


GATGGTATCG 


ACGATTTATT 


12780 


AGAAATGATA GGATTAGTTG 


CAGAAGTTCA 


AGAACTTAAA 


GCAAATCCTA 


AAAACCGTGC 


12840 


TGTTGGTACA GTTATCGAAG 


CTGAATTAGA 


TAAATCACGT 


GGTCCTTCTG 


CATCATTATT 


12900 


AGTACAAAAC GG TACATTAA 


ATGTTGGTGA 


TGCGATTGTA 


GTTGGTAATA 


CTTACGGCCG 


12960 


TATCCGTGCA ATGGTTAATG 


ACTTAGGTCA 


AAGAATCAAA 


ACGGCTGGTC 


CATCAACGCC 


13020 


TGTTGAAATT ACAGGTATTA 


ATGATGTGCC 


ACAAGCTGGG 


GATCGCTTTG 


TTGTATTTAG 


13080 


TGATGAAAAA CAAGCTCGTC 


GTATTGGTGA 


ATCAAGACAC 


GAAGCTAGCA 


TTATACAACA 


13140 


ACGTCAAGAA AGTAAAAATG 


TTTCATTAGA 


TAACCTGTTT 


GAACAAATGA 


AACAAGGTGA 


13200 


AATGAAAGAT TTAAACGTTA 


TTATTAAAGG 


TGATGTTCAA 


GGTTCTGTTG 


AAGCTTTAGC 


13260 


TGCATCATTA ATGAAAATTG 


ATGTTGAAGG 


CGTAAATGTT 


CGTATCATTC 


ATACAGCGGT 


13320 


TGGTGCAATT AATGAGTCAG 


ACGTGACACT 


TGCTAATGCC 


TCAAATGGTA 


TTATCATTGG 


13380 


TTTCAATGTT CGTCCAGACA 


GTGGTGCAAA 


ACGTGCTGCA 


GAAGCTGAAA 


ATGTTGATAT 


13440 


GCGTTTACAC AGAGTTATTT 


ATAATGTTAT 


CGAAGAAATT 


GAATCAGCGA 


TGAAAGGTTT 


13500 


ACTTGATCCA GAATTTGAAG 


AACAAGTTAT 


CGGACAAGCT 


GAAGTTCGTC 


AAACATTCAA 


13560 


AGTTTCTAAA GTTGGTACTA TTGCTGGATG 


TTATGTTACT 


GAAGGTAAAA 


TTACG CG AAA 


13620 


TGCTGGTGTA CGTATTATTC 


GTGATGGTAT 


TGTTCAATAT 


GAAGGCGAAT 


TAGATACACT 


13680 


TAAACGTTTC AAAGATGATG 


CTAAGGAAGT 


TGCAAAAGGT 


TATGAATGTG 


GTATTACAAy 


13740 


TGAAAACTAC AATGACCTTA 


AAGAAGGCGA 


TGTTATCGAA 


GCATTTGAAA 


TGGTTGAAAT 


13800 


TAAG CGTTAA TTAAATAAAT 


TACAAGCTAA 


AAGTATAGTT 


AAGATTGATA 


TGCTCCCTAT 


13860 


AAATATTGCA CTTTTTAAGT 


GTCTACTTTA 


TAGGGAGCAT 


ATTTGATACT 


AGCTTTTGGT 


13920 


TTTTTATTAG AATAGATTAC 


CTATTAAAAG 


TTACGTTATA 


TGGACATGAT 


TTT GTAT AAA 


13980 


ATTTTGTGGT GGCCTAGAAT 


GATTTTTAAT 


GACAAAATAT 


AATGTCGACT 


ATTATTGGAA 


14040 


AATTTTCTGT TGaAATGCCT 


ATCTTACGGC 


AAACTTTATT 


TGATTTTATA 


GG CTTAATTT 


14100 


ATTAAAATAA CGTGTGAGCT 


AAAATAATTG 


TTTAAG CATT 


GTTACACTAA 


AAAATGCAAA 


14160 


TAACAATTGA ACTTAAAGAT 


AAAGAGGTGA 


CAAGAATGAG 


CAGTATGAGA 


GCAGAGCGTG 


14220 


TTGGTGAACA AATGAAGAAG 


GAATTAATGG 


ATATCATCAA 


CAATAAAGTC 


AAAGATCCTC 


14280 


GAGTTGGTTT TATTACAATT 


ACAGATGTTG 


TTTTAACAAA 


TGATTTAT CG 


CAGGCTAAAG 


14340 


TATTTTTAAC TGTATTAGGT 


AACGATAAAG 


AAGTAGAAAA 


TACATTTAAA 


GCACTTGATA 


14400 


AAGCAAAAGG CTTCATTAAG 


TCTGAATTAG 


GTTCTAGAAT 


GCGATTACGT 


ATTATGCCGG 
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AAGATTTACA 
TTCTTAATAT 
CATTTTCCAG 
AAGAAGGTGA 
GTCATGACGT 
GTACGCTTGA 
TTAGTGATTA 
GTACAACGAC 
ATTTTAATAA 
TTCCGCCGAT 
ATAATGAAAC 
CTGAATTAGA 
GTACATATAT 
TGTCGAAATT 
AACAAATAAA 
ATGGATTAAA 
TAAATGGGCA 
TTATTGATGA 
CAGAAATTAA 
AGtGACACAT 

attTttcgat 
tgaggcacgc 
gaatcctaaa 
tagccaacat 
gagcgtagaa 

TGG TTTTG AT 
TGATGCGTTT 
AACTTCTATT 
CTATATATAT 



CAAACAAGAT 
CGGTATATTA 
TTTTTTTATG 
CTATATGTAT 
TGTATTCAAA 
TCCCGAAGTT 
TGTTATGGAT 
TGAAGATCAA 
GGACGATATT 
GTACTCATCC 
AGTTGAAAGA 
TTTTAAAGAA 
TAGAACGCTA 
AACACGAATC 
AGAACTTCAT 
GGGTTTGCCA 
GAAATTTAAT 
TGATTCAGAA 
ACCTAAAAAA 
CCTATACAAT 
GGCATGCATA 
AGTTTAAAAA 
AGAAAACGAA 
GATATTGATT 
GATTTTGTTG 
TTTACTTTTG 
AATACGACAA 
CGTCAAGATT 
TCTATTAAAG 



AGATAATTTA GTGTTAGGTA 
ACATTAAACA GTTAATACAT 
AATAAATTTA GTTGATACGC 
AATGGGATAT TACCAGTATA 
TTGCGTAAAA TATTAAAAAC 
GCAGGCGTGT TACCGGTATG 
ATGGGCAAAG CTTATGAAG C 
ACGGGTGATA CATTGGAAAC 
GACCGATTGT TAGAAAGTTT 
GTCAAAGTAA ATGGTAAAAA 
C CAAAGCGT A AAGTtAATAT 
AATGAGTGTC ATTTTAAAAT 
GCAACTGATA TTGGTGTGAA 
GAGTCTGGTG GATTTGTGTT 
GAGCAGGATT CATTGCAAAA 
AGCATTAAAA TTAAAGATTC 
AAAAATGAAT TTGATAACAA 
AAAGTATTAG CAATTTATAT 
GTCTTTAATT AAAG GAG ATA 
CTAAACAGTA TATTACAGAG 
AAGGTCATGA CAAAGTCTTT 
AAG CGGTGAT GACATTTGAT 
CAACGTATTT AACG CCACTT 
ATTGTATAGT GGTTAATTTT 
AAAATTATAT AATTAAAAAT 
GTAAATTTGG AAAAGGTAAT 
TTGTGAGTAA ACAAGAAATT 
TAATCAATGG TGAGTTGCAA 
kCACTGTAGT GCAAGGTGAA 



TCTGGAAAAT 
AGATGTGTAG 
TATTAAAATA 
TAAAGAGCGC 
TAAAAAAATA 
TATAGGTAAT 
AACTGTATCG 
AAAAGGTGTA 
TAAAGGTATC 
ATTATATGAA 
TAAAGACATT 
ACGCGTCATC 
ATTAGGCTTT 
GAAAGATAGC 
TAAATTGTTT 
GCACATAAAA 
AATTAAAGAC 
GGTACACCCT 
GAATTTATGA 
GATGTTGCAA 
GATATATTAA 
CCGCATCCGT 
TCAGATAAAA 
TCATCTAGGT 
AATGTAAAAG 
ATGACTGTAC 
GAAAATGAAA 
AAAGCGAATG 
AAAAGGGGAA 



GTTTGATAAT 
AAATAGTTAA 
TATTTTAAAA 
GGTTTAACAA 
GGTCACACGG 
GCAACGAGAG 
ATAGGAAGAA 
CACTCAGCAG 
ATTGAACAAA 
TATGCGCGTA 
GGGCGTATAT 
TGTGGTAAAG 
CCGGCACATA 
CTTACATTAG 
CCTTTAGAAT 
AAACGTATTT 
CAAATTGTAT 
ACAAAAGAAT 
AAGTCATAGA 
TGGCATTCGG 
ACGAAATAGC 
CTGTCGTGTT 
TCGAAAAAAT 
TTGCTAATGT 
AAGTCATTGC 
TTCAAGAATA 
AAATTT CTAC 
ATGCTTTAGG 
GAACTATTGG 



14580 
14640 
14700 
14760 
14820 
14880 
14940 
15000 
15060 
15120 
15180 
15240 
15300 
15360 
15420 
15480 
15540 
15600 
15660 
15720 
15780 
15840 
15900 
15960 
16020 
16080 
16140 
16200 
16260 
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TGCTGTTAGT ATTGAAATCG GCACTGAAAA 
TGTAAAGCCA ACATTTCATG ATCCTAACAA 

5 

TGACTTTGAG GATAATATTT ATGGTGAACG 
TCCTGAGATT AAATTTGATG GTATCGACCC 
GCGTGCTAAA TATTTATTAG CAGTTGATTT 

to 

TTGCGTATAG t TATATAAAC AATCTATACC 
ACGCCTAACT CGGATTAAGG AGTATTCAAA 

)s TTCACAAGAA CGTAAAAACG AAATCATTAA 

TTCAC CAGAA GTACAAATCG CTGTACTTAC 
ACGTACACAC AAAAAAGACC ACCATTCACG 

20 TAGcATTTaT TAAACTACTT ACGTaGTAAA 

TCACTTGGTA TCCGTCGTTA ATCTTAATAT 
TCCAACCTTA ATTTATATTA AAAAAGCTTT 

25 GCTAATATTG AGTGAATAAT AAGGTTACAA 

GTAATAATCA AGATATTAAA AATAAAGTAT 
ACTGATAAGG GTGGGACGAT AAGTCTATTT 

30 TTTTTTCCAA TTCAATATTT TATAACTAAT 

AACTATTAGA TTCAAGAGAG GAGATTTATA 
GAATGGGCAG GAAGATCTTT AACGATTGAA 

35 

GCTGTATTGG TTCGTTATGG AGATACAGTC 
CCTCGTGATG GAGATTTCTT CCCATTAACA 
GGTAAAATTC CTGGTGGATT TAAAAAGAGA 

40 

ACTGCGCGAT TAATTGATAG ACCAATTAGA 
GTTCAAATTA TGAACATGGT ATTAAGTGCA 

4S ATGATTGGTT CATCTATGGC GCTTAGTGTG 

GGTGTAAATG TGGGTTATAT TGACGGTAAA 
GAAGTTTCTC GTTTAGACCT TGAAGTAGCT 

SO GCAGGCGCTA GTGAGATTAC TGAACAAGAA 

GAGATTCAAC GTTTAGTTGA TTTCCAACAA 



TAAATTATAT CGAGGGGTAG CTAACATAGG 16 3 80 

AGCAGAAGTT GTCATCGAAG TGAATATCTT 16440 

AGTGACCGTG AATTGGCATC ATTTCTTACG 16 500 

ATTAGTTAAA CAAATGAACG ATGATAAATC 16 560 

TGGTGATGAA GTAGCTTATA ATATCTAGAG 16 620 

ACACCTTTTT CTTAGTAGGT CGAATCTCCA 16680 

CATTTTAAGG AGGAAATTGA TTATGGCAAT 16740 

AGAATACCGT GTACACGAAA CTGATACTGG 16800 

TGCAGAAATC AACGCaGTAA ACGAACACTT 16860 

TCGTGGATTA TTAAAAATGG TAGGTCGTCG 16 920 

GATATTCAAC GTTACCGTGA ATTAATTAAA 1698 0 

AACGTCTTTG AGGTTGGGGC ATATTTATGT 17040 

TTACAAATAT TAACATTTAT TATATGTTAA 17100 

TGAGATAAAG ATGATATAAG TACACCTAGA 1716 0 

GTTTTTTTAA AAAATATAAC TTATATTTAT 17220 

TGTAAATAAT AGATGGATAT CCCGCTCTCT 17280 

ATTAAAATAC GATAATAAAT GATATGATAT 17340 

ATGTCTCAAG AAAAGAAAGT TTTTAAAACT 17400 

ACAGGGCAAT TAGCTAAACA AG CAAATGG C 17460 

GTGTTATCGA CGGCAACTGC ATCAAAAGAA 17520 

GTGAACTATG AAGAAAAAAT GTACGCTGCG 17580 

GAAGGACGTC CTGGTGACGA TGCAACATTA 1764 0 

CCTTTATTCC CTAAAGGATA TAAGCATGAT 1770 0 

GATCCTGATT GTTCACCACA AATGGCTGCA 1776 0 

T CGGATATTC CATTCCAAGG GCCAATCGCC 1782 0 

TATATCATTA ACCCAACAGT AGAAGAAAAA 17880 

GGTCATAAAG ATGCGGTAAA CATGGTAGAG 17940 

ATGTTAGAGG CGATTTTCTT TGG TCATGAA 18000 

CAAATCGTCG ACCACATTCA ACCTGTTAAA 1806 0 
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GAAGAAAAAG GACTTAAAGA AACAGTTTTA ACATTTGATA AACAACAACG AGATGaAAAT 18180 

CTTGATAACT TAAAAGAAGA AATCG TCAAT GAATTTATCG ATGAAGAAGA TCCAGAGAAT 18240 

GAaTTACTTA TTAAAGAAGT TTATGCAATT TTAAATGAAT TAGTGAAAGA AGAAGTTCGA 18 300 

CGTTTAATTG CAGATGAAAA AATTAGACCA GACGGCCGTA AACCTGATGA AATCCGTCCA 183 60 

TTAGATTCTG AAGTTGGTAT TTTACCTAGA ACGCATGGTT CAGGTCTATT TACACGTGGT 184 20 

CAGACTCAAG CACTTTCAGT TTTAACATTA GGTGCTTTAG GCGATTATCA ATTAATTGAT 184 80 

GGTTTAGGAC CTGAAGAAGA AAAAAGATTC ATGCATCATT ACAACTTCCC GAATTTTTCA 18 540 

GTAGGTGAAA CTGGTCCAGT ACGTGCGCCA GGTCGTCGTG AAATTGGACA TGGTGCGTTA 18600 

GGTGAAAGAG CATTAAAATA TATTATTCCT GATACTGCTG ATTTCCCATA TACAATTCGT 18660 

ATTGTAAGTG AGGTACTTGA ATCAAATGGT TCATCATCTC AAGCGTCAAT TTGTGGATCA 18 720 

ACATTAGCAT TAATGGATGC GGGCGTACCG ATTAAAGCAC CAGTTGCTGG TATTGCTATG 18780 

GGCCTTGTTA CACGTGAAGA TAGCTATACG ATTTTAACTG ATATCCAAGG TATG GAAGAT 18 840 

GCATTAGGTG ATATGGACTT TAAAGTCGCT GGTACTAAAG AAGGTATTAC AGCAATCCAA 18 900 

ATGGATATTA AAATTGACGG TTTAACGCGT G AAATTAT CG AAGAGGCTCT AGAACAAGCG 18 960 

AGACGTGGTC GTTTAGAAAT AATGAATCAT ATGTTACAAA CAATTGATCA ACCACGTACT 19 020 

GAATTAAGTG cTTACGCGCC AAAAGTTGTA ACTATGACAA TTAAACCAGA TAAGATTAGA 190 80 

GATGTTATCG GACCTGGTGG TAAAAAAATT AACGAAATTA TTGATGAAAC AGGTGTTAAA 1914 0 

TTAGATATTG AACAAGATGG TACTATCTTT ATTGGTGCTG TTGATCAAGC TATGATAAAT 19200 

CGTGCTCGTG AAATCATTGA GGAAATTACA CGTGAAGCGG AAGTAGGTCA AACTTATCAA 19260 

GCCACTGTTA AACGTATTGA AAAAT AC GGT GCGTTTGTAG GCCTATTCCC AGGTAAAGAT 1932 0 

GCGTTGCTTC ACATTTCACA AATTTCAAAA AATAGAATTG AAAAAGTGGA AGATGTATTA 19380 

AAAATCGGTG ACACAATTGA AGTTAAGATT ACTGAAATTG ATAAACAAGG TCGAGTAAAT 19440 

GCTTCACATA GAGCATTAGA AGAATAATAT TTAAAGTCAT ATGACGACAA TGTATCGTCA 19500 

TGTGATTTTT TTATGCCACT TTTTACGAAG TGACCCGTTT TGAATTTGTT GTATTGAACA 19560 

TTTTAAAACG CTTTATTATT TTGTGTGCAA CTGTTAATTA TCCTGTATGT ATAGTGATTA 1962 0 

ATAGTGTACA TCAAGTGTTT TTTAACTTAT AATGAATAGT GAGTTTATAT ATGGACGGGT 196 8 0 

AACAAATTTA GGAGGTAAGA TTTTGAGTTT AATAAAGAAA AAGAATAAAG AT ATT CG CAT 19740 

TATACCATTA GGCGGTGTTG GCGAAATTGC TAAAAATATG TATATCGTTG AAGTAGACGA 1980 0 

TGAAATGTTT ATGTTAGATG CTGGACTTAT GTTTCCAGAA GACGAAATGC TAGGTATTGA 19860 
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CCTTACACAC 


GGACATGAGC 


ACGCGATTGG 


TGCAGTGAGT 


TATGTTTTAG 


AACAATTAGA 


19980 


TGCACCAGTA 


TATGGATCTA 


AATTGACAAT 


AGCGTTAATT 


AAAGAAAATA 


TGAAAGCCCG 


20040 


TAATATTGAT 


AAAAAAGTTC 


G CT ACT AT AC 


AGTTAATAAT GATTCAATTA 


TG AG ATT CAA 


20100 


AAACGTGAAT 


ATTAGTTTCT 


TTAATACGAC 


ACACAGTATT 




TAGGTGTTTG 


20160 


TATTCACACT 


TCATATGGTG 


CCATTGTGTA 




TTTAAGTTTG 


ACCAAAGTTT 


20220 


ACATGGACAT 


TATGCACCAG 


ATATTAAACG 






AAGGCGTATT 


20280 


TGTCTTAATC 


AGTGATTCTA 


CTGAGGCAGA 


GAAACCTGGA 


TAT AATACT C 


CGGAAAATGT 


20340 


GATTGAACAT 


CATATGTATG 


ATGCTTTTGC 


AAAAGTGCGA 


GGTCG CTTGA 


TAGTTTCATG 


20400 


TTATGCTTCG 


AACTTTATAC 


GTATTCAGCA 


AGTTTTAAAT 


ATTGCTAGCA 


AGCTAAATCG 


204G0 


TAAAGTGTCA 


TTTTTAGGAA 


GATCACTTGA 


AAGTTCATTT 


AATATTGCTC 


GTAAAATGGG 


20520 


GTATTTCGAC 


ATTCCTAAAG 


ATTTGCTAAT 


TCCTATAACA 


GAAGTTGATA 


ATTATCCTAA 


20580 


AAATGAAGTG 


ATAATTATAG 


CTACTGGTAT 


GCAAGGAGAA 


CCTGTAGAAG 


CCTTAAGTCA 


20640 


AATGGCGCAA 


CATAAGCATA 


AAATTATGAA 


TATCGAAGAA 


GGCGATTCTG 


TATTTTTAGC 


20700 


AATTACGGCT 


TCTGCTAATA 


TGGAAGTTAT 


CATTGCGAAT AcATTAAATG AGCtTgTtAC 


20760 


GnCTGGCGCA 


CATATTATTC 


CAAATAACAA 


AAAG ATT CAT 


GCTTCAAGTC 


ATGGTTGCAT 


20820 


GGAAGAATTA 


AAAATGATGA 


TTAATATTAT 


GAAACCTGAA 


TACTTTATTC 


CTGTACAAGG 


20880 


TGAATTTAAA 


ATGCAGATAG 


CACATGCGAA 


GCTAGCAGCT 


GAAGCAGGTG 


TTGCACCAGA 


20940 


AAAGATTTTC 


CTTGTGGAAA 


AAGGAGATGT 


CATTAATTAC 


AACGGTAAAG 


ATATGATATT 


21000 


AAATGAAAAG 


GTAAATTCAG 


GAAATATTTT 


AATAGATGGC 


ATTGGTATTG 


GGGATGTAGG 


21060 


AAATATCGTG 


TTGAGAGACC 


GTCATCTTTT 


AGCAGAAGAT 


GG TATCTTTA 


TTGCTGTTGT 


21120 


AACGTTAGAT 


CCTAAAAATA 


GACGTATAGC 


TGCGGGACCT 


GAAATTCAAT 


CTCGTGGGTT 


21180 


TGTATATGTA 


CGTGAAAGTG 


AAGACTTATT 


ACGTGAAGCA 


GAAGAGAAAG 


TACGTGAAAT 


21240 


AGTAGAGGCT 


GGTTTACAAG 


AAAAACGCAT 


AGAATGGTCT 


GAAATTAAAC 


AAAATATGCG 


21300 


TGATCAAATT 


AGTAAACTAT 


TATTCGAAAG 


TACAAAACGT 


CGTCCTATGA 


TTATTC CAGT 


21360 


AATTTCTGAA ATTTAATCAA 


AAAGTCATTA 


ACATAAAAGA 


GGTCAGAACA 


AGTCACTGAA 


21420 


ATATAATGGT 


TGTCATGGAC 


AATTTACTTA 


TATTTTATGA 


TAGTCAATTG 


AAGGGGTAAC 


21480 


GATTAATCTG 


TTATCTTAAG 


TAAATTGATA CATAGATGAT ATTGTTCTAA 


CCTCTTTCAT 


21540 


CGTCTGTTTG 


GACTACATAT 


TCTAAACATC 


AAATAGGAAA 


TTATATATAA 


TAACGTCGTT 


21600 


TTAACTAAGG 


CAACATAAGG 


AGGTGCGTCA 


ATTGGCACAA 


GCAAAAAAGA 


AATCGACAGC 


21660 
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GATACGTTAT GTCATAGCTA TTTTAGTAGT TGTATTAATG GTGTTGGGTG TTTTCCAATT 21780 

AGGAATAATA GGTCGTCTAA TTGACAGCTT CTTTAATTAT TTATTTGGGT ACAGTAGATA 21840 

TTTAACATAT ATTTTAGTAC TCTTAGCAAC TGGTTTTATT ACATACTCTA AACGTATTCC 2190 0 

TAmaACTAGA CGAACGGCTG GTTCGATTGT ATTGCAAATT GCATTGCTAT TTGTATCACA 2196 0 

GTTAGTTTTT CATTTTAATA GTGGTATCAA AGCTGAAAGA GAACCTGTAC TTTCTTATGT 2202 0 

GTAT CAGTCA TACCAACACA GTCATTTCCC AAATTTTGGT GGCGGTGTAT TAGGCTTTTA 2208 0 

TTTATTAGAG TTAAGCGTAC CTTTAATTTC ATTATTTGGT GTATGTATTA TTACTATTTT 2 214 0 

ATTATTATGC TCAAGTGTTA TTTTATTAAC AAACCATCAA CATCGTGAAG TTGCAAAAGT 222 00 

TGCACTGGAA AATATAAAAG CTTGGTTTGG TTCATTTAAT GAA 2 2243 
(2) INFORMATION FOR SEQ ID NO: 165: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5510 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 165: 

TTATTAATnA TTAATATTTT TATTTTTAAA AATAAAGCGA GGAGCTATCA ATGGAACAAA 6 0 

TTACTTCTGC ACAAAATAAT AGAATTAAAC AAGCGAACAA GCTAAAAmAG AAACGTGAGA 12 0 

GGGATAAAAC TGGATTAGCT TTAATTGAAG GTGTGCATTT AATTGAAGAA GCTTATCAAA 180 

GTGGAATTGT AATTACACAA TTATTTG CAA TTGAACCGGC AAGATTAGAT CAGCAAATTA 24 0 

wCGCATACGC GCAAGAAGTT TTTgAAATAA ACATGAAAGT TGCTGAATCT TTATCAGGTA 3 00 

CAGTSaCACC ACAAGGGTTT TTCGCAATCA TTGAGAAGCC GCATTATGAT ATTTCTAAAG 3 60 

CACAACAAGT ATTGCTCATC GATCGTGTTC AAGATCCTGG AAATTTAGGC ACATTAATTA 4 20 

GAACTGCGGA TGCTGCTGGA ATGGATGCTG TAATAATGGA GAAGGGTACG ACAGATCCTT 4 80 

ATCAAGATAA AGTGTTGCGA GCGAGTCAAG GTAGTGTTTT CCATTTGCCA GTTATGACAC 54 0 

AAGATCTCGA TACGTTTATT ACTCAATTTA ATGGTCCTGT TTATGGTACA GCACTTGAAA 6 00 

ACGCAGTGg C ATACAAAGAA GTTACTTCAA GTGATTCTTT TGCATTACTA TTAGGTAATG 6 60 

AGGGAGAAGG TGTTAATCCT GAATTATTAG CACATACTAC ACAAAATTTA ATCATACCTA 720 

TTTATGGTAA AGCTGAAAGT TTAAATG TAG CGATTGCAGG TAGTATTTTA CTTTATCATT 780 

TGAAAGGTTG ACCGTGTTGA AAGTTTTCCG ATATAATTAT AATTAATTGT TTAACAGAAC 84 0 
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ATAAATAATT GTTTTAGGGA GAATAATCGT GACTGCAAGT TATTCCAATT ATTTAAAGTC 96 0 

TTTTCACCTT TTTGGTTACT TAAAGAGATT TAAGTCGGAA AGACAATCCG TTATCAATAT 1020 

TAAACAAGTG TATGCTTAGG CATAAATTTG GGTGGTACCA CG GAAATG AC TTTCGTCCCT 10 8 0 

TATTTTTTAA GAGGATGAAA GTCTTTTTTT AGTTAAACAA CAAATATGAT AAATAGAAAA 114 0 

TGAATAGTTC GAATAGGGAG GTCAGTGACA TATGTCTGAA CAACAAACAA TGTCAGAGTT 1200 

AAAACAACAA GCGCTTGTAG ATATTAATGA AGCAAATGAT GAACGTGCAC TGCAAGAAGT 126 0 

TAAAGTGAAA TACTTAGGTA AAAAAGGGTC AGTTAGCGGA CTAATGAAAT TGATGAAGGA 132 0 

TTTGCCGAAT GAAGATAAAC CTGCGTTTGG TCAAAAAGTG AATGAATTGC GTCAAACAAT 13 80 

TCAAAATGAA TTAGATGAAA GACAACAGAT GTTAGTTAAA GAAAAATTAA ATAAGCcAAT 144 0 

TGGcTGAAGA AACAATTGAT GTATCATTAC CAGGTCGTCA TATTGAAATC GGTTCAAAGC 1500 

ATCCATTAAC ACGTACAATA GAAGAAATTG AAGACTTATT CTTAGGTTTA GGTTATGAAA 15 60 

TTGTGAATGG ATATGAAGTT GAACAAGATC ATTATAACTT CGAAATGCTG AATTTACCTA 162 0 

AATCACACCC TGCACGTGAT ATG CAAGAT A GTTTCTATAT TACGGATGAA ATTTTATTAC 16 80 

GTACGCATAC ATCAC CAGTG CAGGCACGTa CGATGGAATC ACGTCATGGT CAAGGTCCAG 174 0 

TTAAAATTAT TTGCCCTGGT AAAGTGTATC GTCGTGACTC TGATGATGCG ACACATAGTC 180 0 

ATCAATTTAC ACAAATCGAA GGATTAGTTG TTGATAAAAA CGTTAAAATG AGTGATTTGA 186 0 

AAGGTACTTT AGAATTGTTA GCTAAGAAAT TATTTGGTGC TGATCGTGAA ATTCGTTTAC 192 0 

GTCCAAGTTA CTTCCCATTC ACTGAACCTT CTGTAGAAGT TGATGTGTCA TGTTTTAAAT 19 8 0 

GTAAAGGAAA AGGTTGTAAT GTGTGTAAAC ACACAGGATG GATTGAAATT TTAGGTGCTG 204 0 

GAATGGTACA TCCTAATGTA TTAGAAATGG CTGGTTTTGA TTCTTCAGAG TACTCTGGAT 210 0 

TTGCATTTGG TATGGGACCA GACCGTATTG CAATGTTGAA ATATGGTATA GAAGATATTC 216 0 

GTCATTTCTA TACTAATGAT GTGAGATTTT TAGATCAATT TAAAGCGGTA GAAGATAGAG 2220 

GTGACATGTA ATGTTGATAT CAAATGAATG GTTGAAAGAA TATGTAACAA TCGATGATTC 22 8 0 

TGTAAGTAAT TTGGCAGAAC GTATTACGCG CACAGGTATT GAAGTGGATG ATTTAATTGA 234 0 

CTACACAAAA GATATCAAAA ATTTAGTTGT CGGCTTCGTT AAGTCAAAAG AGAAACATCC 24 0 0 

TGATGCTGAT AAATTAAATG TTTGCCAAGT TGATATCGGA GAAGACGAAC CTGTACAAAT 24 6 0 

CGTTTGTGGT GCACCGAACG TTGaTGCAGG ACAATATGTC ATTGTTGCTA AAGTAGGTGG 252 0 

CAGATTGCCT GGTGGTATTA AAATTAAGCG TGCCAAATTA CGCGGTGAAC GTTCAGAAGG 258 0 

TATGATTTGT TCG TTACAAG AAATTGGTAT TTCAAGTAAC TATATAC CGA AAAGTTTTGA 264 0 



814 



EP 0 786 519 A2 



ATATTTAGAT GATCAAGTAA TGGAATTTGA TTTAACGCCG AATCGTGCAG ATGCTTTAAG 2760 

TATGATAGGT ACTG CTTATG AAGTTGCAGC ATTATATAAT ACAAAAATGA CTAAGCCAGA 2820 

GACAACATCA AATGAGCTTG ATTTATCTGC AAATGATGAA CTGACTGTGA CAATTGAAAA 28 80 

TGAAGATAAA GTAC CAT ATT ATAGTGCACG TGTTGTTCAC GACGTGACAA TTGAACCCTC 2 94 0 

GCCAATTTGG ATGCAAGCAC GCTTAATAAA AGCGGGTATA CGTCCTATTA ATAATGTTGT 3 00 0 

TGACATTTCA AATTATGTGT TATTAGAATA CGGTCAACCA TTGCACATGT TTGATCAAGA 3 06 0 

TGCGATTGGT TCACAACAAA TTGTTGTTCG TCAAGCTAAT GAAGGCGAAA AAATGACAAC 3120 

ATTAGATGAT ACAGAACGTG AATTATTAAC GAGCGATATT GTCATTACTA ATGGACAAAC 3180 

TCCAATTGCA TTAGCTGGTG TTATGGGTGG CGATTTTTCA GAAGTTAAAG AACAAACATC 3 24 0 

AAATATAGTG ATTGAAGGTG CTATTTTTGA TCCAGTTTCA ATTCGT CATA CATCAAGACG 3 3 00 

TTTAAATTTA CGCAGTGAAT CATCTAGTCG TTTTGAAAAA GGAATAGCTA CTGAATTTGT 3 3 60 

AGATGAAGCA GTCGACCGTG CATGTTATTT ATTACAAACT TATGCAAACG GAAAAGTGCT 34 20 

AAAAGATAGA GTGTC TTCAG GAGAACTTGG TGCATTTATT ACACCAATCG ACATCACTGC 34 8 0 

TGATAAAATT AATCGCACTA TTGGATTTGA TTTGTCACAA AATGATATTG TTACTATTTT 3 54 0 

TAATCAACTA GGGTTTGATA CAGAAATAAA TGATGATGTT ATTACAGTGC TAGTACCATC 3 6 00 

ACGTCGTAAA GATATTACAA TTAAAGAAGA TTTAATTGAA GAAGTTGCAC GTATATATGG 36 60 

ATACGACGAT ATTCCATCAA CGTTACCTGT CTTCGATAAA GTTACTAGTG GTCAGCTAAC 3720 

TGATCGCCAA TATAAAACTA GAATGGTTAA AGAAGTGTTA GAAGGTGCTG GATTAGACCa 37 8 0 

AGCTATTACG TATTCGTTAG TTTCTAAAGA AGATGCTACT GCaTTTTCGA TGCAACAGCG 3 84 0 

TCAAACAATT GATTTATTGA TGCCAATGAG TGAAGCGCAT GCGTCATTAC GTCAAAGTTT 3 90 0 

ATTACCACAT TTAATCGAAG CGGCATCATA TAATGTGGCA CGCAAAAATA AAGATGTAAA 3 96 0 

ATTATTTGAA ATCGGCAATG TCTTCTTTGC TAATGGAGAA GGTGAACTAC CAGATCAAGT 4 02 0 

TGAATATTTA AGTGGTATTT TAACTGGAGA TTATGTAGTC AATCAATGGC AAGGTAAGAA 4 080 

AGAAACGGTT GATTTCTATT TAGCAAAAGG TGTCGTGGAT CGAGTATCTG AAAAGTTAAA 414 0 

TCTTGAATTT AGTTATCGCC GTGCTGATAT TGaTGGATTA CATCCAGGTC GTACTG CTG A 4 200 

AATCTTATTA GAGAATAAAG TTGTTGGTTT TATTGGTGAA TTACATCCAA TATTAGCAGC 4 260 

TGATAATGAT TTAAAACGTA CGTATGTTTT TGAGTTGAAT TTTGATGCAT TAATGGCTGT 4 3 20 

GTCGGTAGGT TACATTAATT AC CAGCCAAT TCCGAGATTC CCAGGCATGT CTCGTGACAT 4 380 

TGCATTAGAA GTAGATCAAA ATATTCCAGC AGCTGATTTA TTATCAACGA TTCATG CACA 444 0 
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AAAAGGTAAA AAATCAATTG CAATACGTTT AAATTATTTA GACACAGAAG AAACATTGAC 456 0 

AG ATGAGCG C GTTTCAAAAG TACAAGCGGA AATTGAAGCA GCATTAATTG AACAAGGTGC 4620 

TGTTATTAGA TAATGATTTA AACCCCATGT ATAAGGATAT CTGAAGTAGA TTGATATCCC 4 68 0 

TAACATGGGG TTTTATTTTT GGGTTCACCA ATTTGGTTCC AATGCATTTA AAAAGTCAAA 474 0 

GAGGAACAGC GGAATACAGA TGATGcTTCG CACAACTGCA TAAAAGCCTC TAATGATTAA 4 800 

AAATCAAAGA GGCTTTAAAA TTTTTTGGGC TTTTTCACGA TTTTTAAAAT GCTTTTTTGA 4860 

AATGGTATCT AAACGTGAAA GACCGTATTT TTTTATAATT TTGGCGGCGA TTACATCGAC 4 92 0 

TTTAGCACCG GCACCTTTAG GAATCGTCAT ATTAATATTT TTTGATATTT GATCCATATA 4 98 0 

TGTAACAAAT GCGTATCGAG AAATTATGCT TGCCACTGCA ATGGCTAATG ACTTCGATTC 504 0 

TCCTTTTGTT TCAAATTTTG TTTTCTTTGG AAGTGGTATA TCTGATAATG CGTAATGGCT 5100 

ATACACTTCG CGTTTTGCGA ACTGATCAAT G AC GATAT AG TCTAATTGAG ACGAATCAAT 5160 

TTTTTCAAGT ACATTTTTGA TGGCTTCATT ATGAAGGGCA GCTTTCATTT TTACTTGAGT 522 0 

CCAGCCTTTT GCTTGCTGAA TATTATATTT TTCATTGTGT AGTGTTAATA ATGAATGTGG 52 80 

TATGAAAGTA ACCAATTGCT CAGCAAGTTC TACAATTTTG GTATCGGTTA ATTTTTTTGA 534 0 

ATCATCTACA CCCAAAGTTT TTAAAATAGG GACATGCTCT TTGGTAACGA AAGCAGCACA 54 00 

CACAGTCAAC GGACCAAAGT AATCGCCACT TCCAGCCTCA TCACTAC CAA TACAGTTAAA 546 0 

TTGrTCATAC ATTAaAGTTg TcCAgAAAAG AATTAGCCAT ATTTnCCTTT 5510 
(2) INFORMATION FOR SEQ ID NO: 166: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9623 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
r (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 166: 

GnTTATACTT ATAAATTTTA CGGGGGTAAT ATAATACTtA TTTACCTGTA ATATATGATA 6 0 

ATTCTTCAGC GGCAGCTGCG TTGATAGTTC TATGAGAAAT GATACCTAAT CCTTTAACAT 120 

TGGATTCTGA AATAACGATA GAACCATCAC TGTTAACTTT TTCAACAAAT GCTACATGAC 180 

CGTAATGTTG ATCTGCACCA AATTGTCCAG CCTCAAATAC AACAGCAGCA TGACGTTTTG 24 0 

GTGTATGACT TACTTGATAA TCA CGGTATT GAGCTCGATT ATTCCAATTA TGTGCATCAC 30 0 

CTAAATCACC TGAGATAGAT GTACCAAATT GTTTCATACG GTTATATACG TACCAAGTAC 36 0 
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ATGAATCATC ATAATCCTTG ATAGAACGTT CATATTTATC TAAATCTGGC ATGCGTTCAT 480 

CGTCAAACTG AGTTAATTGA TAGTGTTTAA TAATACTGTT TAATTTCTTA GCATAGTTTG 540 

GATCTGTAGC ATATGTTTTA GATAAGTGTG ATGTTGCATC TTTATAAGAA TCGGCTTCCG 600 

ATTTCCATGT TGGTTTATAA ATTGTTCGAT TGCCATCAAT ACCATTTTTA ATAAGGTCAG 660 

AGTAATCTTT TAGTGATTCT TTCGTGCTTG GATATTTTCG GAATCCAGCA TTAATACTAT 720 

ACAATTGATT ACCATCAGCT TCTAATGTGT TAAAAGGAAC AGAATTCCCT TCaAAAGCAC 780 

CTTTGATACC GAATAAATTA TGGTTTGGTG ACwTAGCTAA AGCACTACGA CCTGAGTCAG 84 0 

ATTCTAAGAT TGCTTGGGCA ATCATGACAG ACGCATAAAT ATCGTTATCT TGACCAATGC 90 0 

GATGTGCATC TTTAGCAATT GATTTGACAA ATTGACGTGT AT CTTTT GAG TCAACAACGT 96 0 

TAAATTGTCC GCTATCATCA TTGTTAGATA TACTAGGATC TGTTTCGAAT AATGATGTTG 1020 

CACGTGTATC CTTTTGATTA ACATCGTTAT TGAATGATTG AGCAGGTTTA GATTTATGTT 1080 

TCAATTCATC TTGTGTTGGT AACTGTGGAT TCTTTGTATT AGATTTTTCA TTTTTGTCTT 114 0 

TTTTAGATTG AGATGCATAA TCTTTTT GTG TTTTCTTTGC ATCTT CACTG TATTGATCCA 1200 

AAATAGAGTC TAAAGCCGAA TCTGACATTG ATTGATTATC TTTCGATGAA GATTTTTGAT 126 0 

TTGCTTTATC GTCACTTGCT GG TTGACTAT TTGATTGATT AGGTTGTGTT GGCTTTGGCG 1320 

AATTTGGTTG CTTATTAGAT GTACTTGGTT TTGTATTGTT TGATTTAGGT GCTTTTTGAT 13 80 

TGTCTG CTTT ATCTTGTTTA GATGATTGCG TATCAGTGTC ATTTTTGATG CTATTGTCAC 1440 

TGTTTTTATT CGAATCATTT GTTGACTTTT CGCCATTACG AGGTTGTTCG TAATCAGAAA 1500 

TATCCGAATT TAAATTGAAT AAGTTTTGGA TTAAAGTTGT TAATGAGTAA TTATCATCGT 15 60 

ATTTATTTTT GGTTAGCAAT TGGTTTATAT TGGTTTGTGG TAAATTCTTA TAAATAAAAT 1620 

CAATSATATT GTTAGAGTCT GAAGTGCTGT CGTCTATAGT TTTAAATTTT TTGTCGTTAT 1680 

TGTCTTGGTT ACTTGTATTA TTTTTGTCTG CTTTATCAAT ATCTTTACTT GTAGTATCCT 1740 

TAGAAGTTTC ATCGTCATTA GATTTTTTTG AATCATGAGA TGTTGTCTTA GCTGTAGTAT 18 00 

CTTTTTGAGG TGTATCAGCA TAAGCGgTAG GTGAAaCTAA AGTAGGTAAT ACGAGCGTAG 18 60 

TTGATAGCAA ATAAATTAAA ATTTTATTTT TAGGCATATT TCGTATTCTC CCTTGAAAAA 1920 

TATAATAATT AAGTGTGATA ATAAACTATG ATTTGTTATA ATTTATCGTA TGCTGAAAAT 1980 

AGTTGATAGG TATCAATCGA CTAAATATCT TCCAGTAAAT TGATTATACT AATTCACAAC 2 040 

GCAAAAATAA ATTAATTTAC AAAAAATATA TAAAAAATAT GAATAATTCC TACATAGGAG 2100 

TGTGACAATG AAGAACGCAT TTAAATTATT TAAAATGGAT CTGAAGAAAG TAGCTAAGAC 216 0 
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TAACTTATGG GCAATGTGGG ATCCATATGG CAACACGGGA CACATCAAGG TCGCAGTCGT 22 80 

TAATGAAGAT AAAGG CGACA CAATCAGAGG GAAAAAAGTT AATGTCGGTA ATACGATGGT 234 0 

TAATACACTC AAGAAAAATA AAAGTTTTGA TTGGCAGTTT GTAAGTAGAG AGAAAGCTGA 24 0 0 

TCATGAGATA AAAATGGGTA AATATTTTGC AGGTATTTAC ATCCCATCTA AGTTTACACA 24 GO 

TGAAATTACA GGGACACTAC GTAAGCAGCC TCAAAAAGCA GATGTAGAAT TTAAGGTGAA 2 52 0 

TCAGAAGATT AACGCTGTTG CGTCTAAGCT AACAGATACT GGTTCGTCAG TTGTCGTTGA 25 BO 

AAAAGCGAAT GAACAATTTA ATAAAACAGT AACTCGAGCA TTATTAGAAG AAGCTAACAA 2 64 0 

AGCAGGTTTA ACTAT TGAAG AAAATGTGCC GACAATTAAC AAGATAAAAA ATGCGGTATA 2 700 

TTCAGCAGAT AAAG CTTTAC CTAAGATTAA TGACTTTGCG AATAAAATTG TATATTTGAA 2 760 

TAACCACCAA GCGGATTTAG ATAAATATGC CAATGATTTT AGAAAACTAG GAAATTATAA 2 82 0 

AGGTGATATT TTAGATGCTC AGAAAAAATT AAACGAaGTC AATGGTGCTA TTCCGCAACT 2 880 

TAATGAAAAG GCTAAGTTGA TATTAGCTTT AAATAATTAT ATGCCGAAAA TTGAAAAAGC 2 94 0 

GTTAAATTTT GCAGCTGATG ACGTGCCAGC GCAGTTCCCT AAAATTAATC AAGGACTTAA 3 000 

CATTG CGAGT CAAGGTATTG ATCAAGCTAA T GGACAGTT A AATGATGCCA AAGGCTTCGT 3 06 0 

CACACAAGTT AGAAGTAGAG TCGGTGATTA TCAAGATGCA ATTCGACGCG CGCAAGATTT 312 0 

AAATCGAAGA AACCAGCAAC AGATTCCTCA AAATAGCGCG GCGAACAACG AAACATCAAA 3180 

TAGTGCACCT GCAGCTGGTA ATGGTGTAGC ATCAACGCCA CCAAGTGCAC CAAGTGGCGA 324 0 

TACTGCACCA AATAATAATG TTACGCAAAA TACCGCACCA AATAGTAATA ATG CGCCTGT 3300 

ATCGACTACA CCACAAAGTA CAAGCGGGAA AAAAGATGGT CAAAGTTTTG TAGATATAAC 33 60 

AACAACACAA GTCAGCACAG CTAACGAGAA CACACAAAAC ATTACAGATA AAGATGTTAA 342 0 

ATCAATGGAA GCGGCATTAA CGGGCTCTTT ATTATCATTA TCAAATAATT TAGATACCCA 34 80 

AGCGAAAGCC GCACAAAAAG ATAGTCAGGC ATTACGTAAT ATTTCGTATG GGATTTTAGC 354 0 

ATCGGACAAG CCTTCTGATT TTAGAGAGTC TTTAGATAAT GTTAAGTCCG GTTTAGAATA 3 600 

CACAACGCAA TATAATCAAC AATTTATCGA TACATTAAAA GAGATTGAGA AGAATGAAAA 3 66 0 

TGTTGATTTA TCAAAAGAAA TTGATAAGGT AAAAGCAGCT AATAATCGAA TTAATGAATC 3 72 0 

ATTAAGG TT A GTTAATCAAT TAAGCAATGC ATTAAAGAAT GGTAGTTCAG GAACTGCTGA 3780 

AGCTACTAAA TTACTAGATC AACTTTCAAA ACTAGATTCA TCATTATCAT CATTTAGAGA 3 84 0 

TTATGTTAAA AAAGATCTTA ACAGCTCTTT AGTATCAATA TCACAACGTA TTATGGATGA 3 900 

ATTGAACAAA GGGCAAACTG CATTATCCAA TGTTCAGTCT AAATTAAATA CAATTGATCA 3 960 
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AACAGTATTA CCAAGTATTG AACAACAATA CATTAGTGCT GTTAAAAATG CTCAAGCAAA 4 080 

CTTCTCGAAA GTGAAAAGTG ATGTAGcTAA AGCTGCTAAC TTTGTGCGCA ATGACTTACC 414 0 

ACAGTTAGAA CAGCGATTAA CTAATGCGAC AGCAAGTGTG AATAAAAATT TACCAACGTT 420 0 

ATTAAATGGT TATGATCAAG CGGTAGGATT ACTAAATAAA AATCAGCCAC AAGCGAAAAA 42 6 0 

GGCTTTATCA GATTTAGCTG ATTTTTCTCA AAATAAATTG CCTGATGTTG AAAAAGATTT 4 32 0 

GAAAAAAGCG AATAAAATTT TCAAGAAATT AGACAAAGAT GATGCAGTCG ACAAATTAAT 43 8 0 

CGACACACTT AAGAATGATT TGAAAAAGCA AGCGGGTATT ATTGCAAATC CTATTAATAA 444 0 

GAAGACTGTT GATGTTTTCC CAGTTAAGGA TTATGGTTCA GGTATGACAC CATT CTATAC 4 500 

TGCACTGTCA GTATGGGTAG GTGCACTCTT GATGGTAAGT TTATTAACGG TTGATAATAA 4 560 

ACATAAGAGT CTAGAGTCAG TCTTAACGAC AAGACAAGTG TTCTTAGGTA AGGCAGGATT 4 62 0 

CTTTATAATG CTTGGTATGT TGCAAGCACT CATTGTATCG GTTGGAGATT TGTTAATCCT 4 680 

AAAAGCAGGA GTTGAGTCAC CTGTATTATT TGTACTTATA ACGATTTTCT GTTCGATTAT 474 0 

TTTCAACTCA ATCGTATATA CGTGCGTATC ATTACTTGGT AACCCAGGTA AAGCCATTGC 4 80 0 

AATCGTATTG CTTGTATTAC AAATTGCAGG TGGTGGGGGA ACATTCCCAA TT CAAACT AC 4860 

GCCACAATTT TTCCAAAACA TTTCGCCATA CTTACCATTT AC GTATGCAA TTGATTCATT 4 92 0 

ACGTGAAACA GTAGGCGGTA TTGTTCCGGA AATCCTAATT ACAAAATTAA TTATATTAAC 4 98 0 

GTTATTTGGT ATAGGATTCT TCGTTGTAGG TTTAATTTTA AAACCTGTAA CAGATCCATT 5040 

GATGAAGCGC GTATCTGAAA AAGTTGACCA AAGTAACGTT ACAGAATAAA AATTAAATCC 5100 

ACACATTAGG GTTATAGCTC CTTAATGTGT GGATTTTTAT GTTTTTAGAC AGAAGAGATA 5160 

GTAATTTCTG TCTTTTATGG GACGGTTGTT ATCATTGCTA TTATCCAGGA TGACTTACTA 5 22 0 

TAG GAC TAAT ATTACCGACA AAGTGAATAT CCTCGTCTTC CGTAGTTAAA ATAAAGCTAG 52 80 

AACCTTTTTG GATGTCATAG TGCTTATCGT TTACTGTTAA AGTACCAGTA CCATCGATAA 5340 

TTGTAACTAA GCAATAAGCA TGTGGTTTAT TGAATTTTAA ATCTCCATGA ATATCCCATT 54 00 

TATATACTGC AAAATATTGA TTATCTACAA ATTGAGTTAC AGTGTGTGTG TCGATGTGAG 54 60 

TTGTTATAGG AGTAGTATTT GGTTCATGAT TGCCTAATTC AATCACATCT TTACTTTGCT 5 520 

CTAAGTGCAA ATCACGCAAT TGACCATTTT GATCTCGTCT ATCATAGTCA TAAATACGGT 5 580 

ATGTCGTATC GGAGGATTGT TGTGTCTCTA AAATTAAAAT ACCCGAACCA ATGGCATGGA 5640 

CAGTGC CAGC AGGAACATAA TAAAAGTCAC CGGGCTTAAC AGGTATACGT TTGAAAAGAC 5700 

TGTCAAATTC ATGATTATCA ATCATGTCTA TTAACGTCTG TTTATTATGT GCATGTACGC 5760 
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GTTCGCCTTC 


GTGTTTTAAA 


GCGTAGTCAT 


CATCTGGGTG 


AACTTGAACA 


GATAATTTAT 


5880 




CATTGGCATC 


TAATACTTTA 


GTTAGCAGAG 


GGAAACTATC 


TCGTGAATCA 


TTATCGAATA 


5940 




ATTCACGATG 


TTGTGACCAA 


AGTTGATCTA 


GGGTCATATC 


CTTGTATGGA 


CCATTGATAA 


6000 




TTGTATTAGG 


ACCATTTGGA 


TGTGCAGAAA 


TTGCCCAGCA 


TTCACCAGTT 


GTTTCATTAG 


60G0 


10 


GGATATCATA 


GTTAAATGCT 


TTTAATGCAT 


GACCGCCCCA 


AATTCTGTCT 


TTAAAAACGG 


6120 


GTTGTAAAAA 


TAATGCCATA 


GTTAAAACTC 


CTCTATATTT 


TCATTAATAA 


GTTATAAATT 


6180 




TCTGTAGTAC 


TGTTTGCATT 


AATTAGTGAT 


TGGCGTGTCT 


CATCATTCAT 


TAACGCTTTA 


6240 


15 


GATAAGCGCT 


GAAGTATTTT 


TAAATGTGTA 


T C CTGACTGT 


TGTTTGGTAC 


GGCAATTAAG 


6300 




AATATCAATT 


GAGGTAGACT ACCATCTAGA 


CTGTCCCATT TAACACCATG 


ATTATTTTTC 


6360 




ATAACAGCTA 


CAATCGGTTG 


TTTTACAACA 


T CAG ACTTTG 


CATGTGGAAT 


GGCCACGTTC 


6420 


20 


ATGCCAATAG 


CTGTCGTAGm 


tCcATTTCAC 


GTTCTAGTAT 


TGCATTTTTT 


AAATGCGATG 


6480 




TGTGCTCTAC 


ATAACGGCAA 


ATTTTAAGTT 


TATGAATCAA 


CATATCAATT 


GCTTCGTTTC 


6540 




GAGACATGTC 


GTGATCAGTA 


ATTATCATAG 


TTTGTTGATC 


AAAAACATGA 


GAAGGTTTAT 


6600 




TGAGATGTGA ATGTTTCGCG 


GTGTTATCTA 


CATTGTCAAC 


CTCTGTATCA 


TGTTGTGTAA 


6660 




TATCTGTATC 


ATGAAGTTGC 


GTGTGTTGCG 


CTGGTGCATC 


TACTGCTATA 


ACTGGTGTAT 


6720 


30 


TGCG TTTTAA 


TAATAGTACA 


GTAGTCATTG 


TGACAAGACT 


ACCTACTATC 


ACTGCAAAGA 


6780 


TAAACCATAA 


TACATGATCA 


ATACCACCTA 


ATACAGCCAC 


GATTGGACCT 


CCATGTGCGA 


6840 




CTCTATCGCC 


GACACCACCA 


ATGGCTGCAA 


TGACTGATGC 


AATCATTGCA 


CCAATGATGT 


6900 


35 


TTGCAGGTAT 


AATGCGCAAT GGATCTTGGG 


CTGCGAAAGG 


AATAG CACCT 


TCAGTAATAC 


6960 




CAAATAGTCC 


CATAGTGAAG 


GAAGC CTTAC 


CCATTTCTCT 


TTCGGAATGA 


TTGAATTTAT 


7020 




ACTTTTGAAC AAACGTTGCT AAACCTAAAC 


CGATTGGTGG 


TGTACATACA 


GCAACTGCGA 


7080 


40 


CCATACCCAT 


AACGGCGTAA 


TTACCTTCAG 


CAATAAGTGC 


TGAGCCAAAT 


AAAAATGCTA 


7140 




CCTTGTTTAC 


TGGACCGCCC 


ATATCGAAGG 


CAATCATCGC 


ACCTATAATC 


AT CGCAAGTA 


7200 




TAATAATATT 


AGCACCTTGC 


ATACTTTTTA 


ACCAGGTTGT 


TAATGCCTCA 


AAAATATTAG 


7260 


45 


AAATTGGTGC 


ACCGATTAAA 


AATATAAATA 


TCAATCCTAC 


AACGACCGAT 


GAAATAATGG 


7320 




GAATAATAAT 


GATAGGCATA 


ATTGGTGCCA 


TTGCTTTTGG 


AACTTTAATA 


TCTTTAATCC 


7380 


50 


ACTTTGCGAT 


ATAACCTGCT 


AAGAAAC CAG 


CAACAATACC 


ACCTAAAAAT 


CCTGCGCCTG 


7440 




CATCACTGCC 


ATAAAAACTA 


CCGTCAGCAG 


CGATAGCGCC 


GCCAATCATA 


CCAGGAACAA 


7500 




GACCGGGcTT 


GTCAGCGATA 


CTAACAGCGA 


TATATCCAGC 


TAGTATTGGA 


ACCATAAATT 


7560 



55 



820 



EP 0 786 519 A2 

ATCCTTTTGA TGTCGTTtCA CCGCCTAGAG TCAGCGCGAT GGCGATAAGG AGTCCACCAA 76 8 0 

CTACGATAAA AGGAACCATA AACGATACAC CGTTCATTAA ATGTTGATAC ACCATTTGAA 774 0 

TACCATTTTT AGACTTACCG CGATCTTTCG AATGATAATT TGTTTCAGAT TGATAAATAG 7 8 00 

GCGCATCTTG ATTAATGATA CGTTGAATTA GACCTCTCGG ATTATGAATC CCTTCGCGAA 786 0 

CATTTTCATT AATCAACCGT TTACCAACAA ATCGGGACAG ATCAACTTGT TTATCAGCTG 7 92 0 

CAATTATGAC ACCGTCAGCT TCTTCGATGT CTTGCGTAGT TAAAACATTT TCAGCACCAA 7 9 80 

CACCGCCCTG TGTCTCTACT TTAATATCCA CACCCATTTC TTTTGCTACC TGCTCAAGCT 8 04 0 

TTTCTTGAGC CATATATGTA TGTGCAATGC CATTTGGGCA TGAGG TAATA GCTACAATTT 8100 

TCATAAAATC ATCTCCTTTT CTATATTGTA AG CGTATTCT CGATACTAAA AAAAAGAATA 816 0 

ATTACCGTTA CTAGTGGCAA TTATT CTTGT AAGTATTCAA ATAACTGTTG CTTTAAACTA 822 0 

TGATCATCTA AACTACATAA ATGGTTCACT GAATCATCAT CCAAGTTAGC AATTAATTGC 82 8 0 

ATCATTTGTT TTGTAAAAGC TTTGTCTTTA TGCGAAATCG CTAAGAAAAA GACAAGTTTG 8340 

ACATCGTGTT GTCGCCAAGG AAAAACATCT TTTGTGCGAA AAATAAGCAC ATGTGATTGT 84 00 

AAAACTTTTT CAGGATCTCC ATGAGGAATC GCCATAAAAT TACCTATGTA TGTAGAAGAT 84 6 0 

GATTTCTCAC GCTCTAAAGC TGATTCGATA TATCCTTCTA CAATCG CATG ATGTGCTTGT 852 0 

AATATTTTTT GAGCTTCTTC AAAAATTTGC ACAGTATGCC GTGATTTTTG TTCAGTATTT 8580 

ACGACAAGGA AATTGACAGT GTCCATATGA TGATGTGCTT GAACCGGATT TTGCTTTTGC 864 0 

TTCACAACGT GTCTGATTTT GTGACGATCA TCTTCAGAAA ATAATGGTGC AACCTTGATA 8700 

GTCGTCAGGT GCTTAGGAAG TATGTTTAGC GTTTGTTTAG GAATATCATG GGTCGTTATT 8760 

AATAAATCTA CATTGTCAAA GTGATAGTGT GTTATATTTT CTAGTTTAAT CGTATTTATC 882 0 

ACTGACAACT CTTCGGATAA GTTATTTATT TTAGTTTCTA AAAAATTCGA CACACCTAGA 8880 

CCATAATAAC AAGCAATGAC TACATTTAAT TGTGTTTTGG TACGACGCTC GATGGCAGCT 894 0 

TGAAAATGAA TTGTTAAAAA TGCAATTTCA TCTTCGCTCA TCTCTATATC AGTATCAATT 9000 

GCTAATTTAT CAATCGCTTC AAAAAGTGTG TTAAACACAA AGGGATAGAG TTTTTTAATC 9060 

TCTATAACTA AAGGATTGTT TAAATAAATG TTTTGAGTGA TACGTAAATA TGCTTTACTA 9120 

AAATGATTAT ATAAATTTTG TTGTAAAATC GAATCTTCAT TGAAAGGTAC ATGAATACGT 9180 

TGCTGCAT CA ATTCGATTAA GCGAT CAATA TAACTTTGTA TAAATATACG TTCTATGCCA 9240 

ATATCGAGTT TATTAAAATG ATAAGCAATA AAGAATGAAA ACATATTGAT TACTTTTTCG 93 00 

TTCAAGTCAT AACCTAATCT TTCGTTGATT TGCTTAATGC AAGATTGAGA TATCAATTTT 9360 
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AGATGAATTA AAAGCTGTTG TATTTGAATA TCAGTTGTTT CAATACTATG TTGTTGAAGT 94 8 0 

GTCTCTTGTA TAATATGCGA AAT CATCCTT TGGTGTGAAT CAGGTAATTC aTTTAAAATT 9 54 0 

AGGTCTTCAA CATGTACATG CCCTGATGAT AATTGATTTA AATGGATGAT GGCATTAGTG 960 0 

ATATCATTAT CTGTTCCATC GAC 96 2 3 



(2) INFORMATION FOR SEQ ID NO: 167: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1021 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 167: 



20 


ACCGTGGAAA 


CACGTCTAGT 


CAATCAGAAA 


GCGATAAAAA 


TGTGACTAAA 


TCATCTCAAG 


60 




AGGAAAATCA 


AGCAAAAGAA 


GAATTACAAA 


GCGTTTTAAA 


CAAAATTAAC 


AAACAATCAA 


120 




GTAAGAATAA 


TTAAAAAATT 


TTGATATTGT 


CTATGTTTAT 


AGTTCACAAG 


CCATTCAACG 


180 




TATTGTAAAC 


TAAGGATAGT 


GTATTTTTTT 


AATAGTAATT 


TGTCAGGAGG 


TGCCTATCTA 


240 




TGGAAGAACA 


TTACTACGTA 


AGTATTGATA 


TTGGATCATC 


AAGCGTAAAA 


ACAATAGTAG 


300 


30 


GCGAGAAATT 


TCACAATGGT 


ATAAATGTGA 


TAGGTACAGG 


ACAAACCTAC 


ACGAGCGGTA 


360 


TAAAAAATGG 


TTTAATTGAT 


GATTTTGATA 


TTGCGCGACA 


AGCAATCAAA 


GACACAATTA 


420 




AAAAGGCATC 


AATCGCTTCG 


GGTGTTGATA 


TTAAAGAAGT 


TTTCCTGAAA 


TTACCTATCA 


480 


35 


TTGGAACGGA 


AGTTTATGAT 


GAATCAAATG 


AAATCGACTT 


TTATGAGGAT 


ACAGAAATCA 


540 




ACGGTTCACA 


TATCGAAAAA 


GTATTAGAAG 


GTATTAGAGA 


AAAAAATGAT 


GTGCAAGAAA 


600 




CAGAAGTAAT 


TAATGTGTTC 


CCGATTCGTT 


TTATAGTCGA 


TAAAGAAAAT 


GAGGTTTCAG 


660 




ACCCTAAAGA 


ATTAATTGCC 


AGACATTCAT 


TAAAGGTTGA 


AGCAGGCGTA 


ATTGCTATTC 


720 




AAAAATCGAT 


TTTAATTAAT 


ATGATTAAAT 


GCGTAGAAGC 


ATGTGGTGTT 


GATGTATTAG 


780 




ATGTTTACTC 


TGATGCATAT 


AACTATGGTT 


CAATCCTAAC 


AGCTACTGAA 


AAAGAGTTAG 


840 


45 


GTGCATGTGT 


CATTGATATT 


GGTGAAGACG 


TTACGCAAGT 


TGCTTTTTAT 


GAACGCGGTG 


900 




AATTAGTAGA 


TGCTGATTCT 


ATCGAAATGG 


CAGGGCGTGA 


TATTACaGAC 


GATaTTGCAC 


960 




aAGGrTTaAA 


CACTTCTnAT 


GAAACTGCTG 


nAAAAAGTTA 


AACACCAATn 


TGGTCATGCA 


1020 



50 

T 1021 
(2> INFORMATION FOR SEQ ID NO: 168: 
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(A) LENGTH: 7963 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 168: 

w TAATCTATTA TAAAAACTGT CCATACCCTT TGATTACCTT CTCTTCAGGT ACAGGCCACA 6 0 

CTTGAGGCCA TAAGCCATAT GCTTGCTGTG AATAAAATTG TGCCATTTGT AACAATATAA 120 

TATATACAAA TAAACACCCA ATAATTGCTG TCACTAATGG ATATGATAAC CAAACCATTA 180 

'5 ATAAAACTGC AATAATTACT AACCTAAAGA TAATATTAAA TGCGTCTCTC CCTCTTATAA 24 0 

AGCTTCTAAT AAATAAGAAT AAATACATCG CATTAGAGTT AAATTTACTA CCCTTTGGAA 300 

CTGGTAAAAG TATATCTAGA TAACTTCTTC TGACTGCAGA TTCTTTCAAA TGTTTTACAT 3 60 

20 

CGGTGAACAT ATTAACAAAT TTATAATAAT TCATATGATG TCGATGTTCG ATTGCAATCA 4 20 

TTTTCTCCCA AGG AT A CAAA AAGCCTGGTT TATATTTTTT AACTAAAAAT TCTATTAACA 4 80 

CAGGCAAAGC AACCATCACA AATGCGATGT ACCATTTTGG AGCTAATAGT AAGTAATATG 54 0 

TTAGAGCAAA GGTGATGAAT GATATTAAAT TAACTTGCCA TGTTTTAAGT CCCGATTGAT 600 

ACCATTGCCA TCTTAAGCGT AAACCAACAT ATGGAAAAAT TAATGCACTG ACTCCAAAAC 66 0 

3Q AAATATAAAA TGCCACATTA TGTTGATTAA TATTGTAAAA CAACGGGAAC ATTACAATAA 72 0 

CAATAATGAG TTGGATTAAT ATGCGCGCAA AGTAACTATA TAAAATCGCA TGACGCATAA 78 0 

ATTGAGACAT GTGTTTTTCA AATGGTAATA AAAAGATTTT ATCCgCTTCT TTTAACAGTG 84 0 

35 GTCsCmTTGG AAAAATAG r T GTCAACGCAA CAATCACTGC TGCTATTaAT GAAAAATTGa 9 00 

TATTCGTTGG AATATGTTTT AACCATTcAC CATATCCArA AATAAATGCA CCCAGCAAAA 96 0 

TAAGTAAAAA GACCATGAAA TGACCATTAA ATATAAACTT ATTATAATAA TTTTtCTCTT 102 0 

40 TACGAAGGGC ATGTAATCTT TTATTAAATA ATGTGGTAGC TTGGTTACGC ATGTACATCT 1080 

CCACCTTGCG TCACATGAAT ATATATATCG TCTAATGTTT GATTATGTAA GCCAGTTTGT 114 0 

TGTCTCAATG CTTCTAAATC TCCAAATGCA ACGACTTCAC CTTCGTCTAG TATGaTAAAA 120 0 

CGATCACAGT AACGTTCAGC TGTTGCTAAA ATATGTGTAC TCATTAGAAC GGTTCTACCT 12 60 

TCGTTTTTCT TTTCAACCAT TAAATCTAAC ATGGATTGAA TTCCTAATGG ATCTAGGCCA 132 0 

so AGGAATGGTT CGTCTATAAT ATACAATTCG GGATTAACGA TAAACGCACA AATAATCATG 138 0 

ACTTTTTGTT TCATCCCCTT AGAAAAATGA CTCGGAAAAA CTTT CAACTC ATTTTCTAAA 144 0 

CGGAATGTCT TTAATAATGG CATTGCT CGA TTCATCGTTT CATCACGATC AAT AT CATAT 1500 
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TCCGGAATAT AAGATAACTT TCTTCTATAA GCCTCTATGT CAT CATT AAT GTTGATATCT 162 0 

GAAATTGATA GAGATCCTTC CATAGGTGTA AGCAATCCTA GCATATGTTT AATCGTTGTA 16 8 0 

CTCTTACCAG CGC CATTAAG GCCAATAAGT CCAACAATTT CGCCTTTGTT TAATTCAAAA 174 0 

TTTATATCTT TAATTACAGG GCGTTTTCCA TATCCACCTG TAAGCTGTTC TACTTTAACT 180 0 

GTCATAAGGC ACCTCCATGA CTTATATTGT ACCAAAAATT ATAAAATGCT CATATTAAAT 186 0 

ACACATGTCC TAATATCGAA TTTTTAGCGA CAATGTTATA ATGAATGGTA ATACTAGTTG 192 0 

AAAAGGAGTG TAGTCATCAT GTCAGAAACA ATTTTCGGCA AAATTTTAAC TGGAGAAATT 1980 

CCTAG CTTTA AAGTATATGA AGACGATTAT GTCTATGCCT TTTTAGATAT ATCACAAGTT 2040 

ACTAAAGGAC ATACGTTATT AATTC CTAAA AAAGCTTCTG CTAATATCTT TGAAACTGAT 2100 

GAAGAAACAA TGAAACATAT CGGTGCAGCA TTACCTAAAG TAG CAAATGC TATTAAGCGT 2160 

GCATTTAATC CTGATGGTTT AAACATTATT CAAAATAATG GTGAGTTTGC AGATCAATCT 2220 

GTATTTCATA TTCATTTCCA CTTAATTCCT CGATACGAAA ATGATATTGA TGGATTTGGT 22 80 

TATAAGTGGG AAACACATGA AGACATTTTA GATAACGATG CAAAACAACA AATTGCTGAA 2 340 

CAAATTCAAG CACAATTTTA AATGTATGCT TAATCTAAGC TCGAACGGGT ATAATATGAT 24 00 

TAATATTATA ACAATTG CGT TTGAAGTGAT AACATCAAGG TTAGCAATTT TAAACAAAAT 24 60 

GAGTTATCAA GATAACAGAT GTTAAAAGTG AGGAGAATAT AAATGAAAGC ATCACGCATT 2520 

CTATTCGGTA TCGGTGTTGG CGTAGCAGCT GGTTTTGTAG TTGCACTTCA AGGACGTGAC 2 580 

GACAAAAGTG TCAAGAACAA CACGATCGAT CGTACTGCCC CTACTGGTTC AAAATCAGAA 264 0 

CTACAACGTG AATTTGAAAC GATTAAACAA AGTTTTAATG ACATTTTAAA CTATGGTGTT 2700 

CAAATTAAAA ACGAAAGTGC GGAATTTGGT AGTTCAATTG GTGGTGAAAT TAAGTCATTA 2 760 

CTTGGAAACT TCAAATCTGA CATTAATCCT AATATTGAAC GTTTACAGTC ACACATCGAA 2 820 

AATTTACAAA ATCGTGGCGA GGATATTGGA AACGAAATTT CTAAGTAGCA GGTTACGTTC 2 880 

TCGATCACAA CTATTTTTAT TAGTAACAGC ATATTTATTT TTTAAAATTA AATGCCAAAT 2 94 0 

AAACGAGATG ACATTAGAAA TTAGATATTT CTTGTCATCT CTTTTTTAAA ACTCAAATGA 3000 

A CTTATGTTT ACAAATTATA GGAAGACATT GTTTGTAGTG ATTTTCGCTT AAATCATATT 3060 

TATGAATTGA TTGAAAACAT TG CTT AGGAT TCATTGTGTT ATCCtTGCAC TTTGATTACG 3120 

CTTTACTTAA ATCATTATCG ACAAACAACA TACTTATATT TTCATTGAGC CGAAC CTTAT 3180 

ATACACATTA CATATACCTT ACTTGCACAA ATTATTAATC TGGTGTTTAT TATAATTACA 3 24 0 

TATCACTATA TTTTTAGCAT TTGTATAACT TAGTTGGTCA AAAGATGCTT TTGCATATGC 3 3 00 
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TTTCATAAGT GATGCTTTAT TAG CAAGAAT ATGTGTTCGC AG AAATT TGT TCTGCATTCT 34 20 

ACTTCTACGC TAGTCAATCA GACAATTTTA CCAATCCCCA CTTTCGCGTT TCAAATCAAA 34 80 

5 CAATACGTCG CTCCTTTCTT CTTATATAAC AATTCTTCTA ACATGATATG TTACTATTGA 3 54 0 

ATTACTGAAC CTGAGTTAGT TATAATCTAA CTTATATTGA AAAGAGATGA GGCGTAAGAT 36 00 

ATGTTTTTAT GTAAAAGACA AATTGATATC AATGCACGAT TTGGTTTGCC TAG AATTG CA 3660 

10 TTTATGAGTG CAGTTGCAAC CATCATTATG TTTTTAGTTA GTTATGAAGT AATGTATTTT 372 0 

TTATCTAATA CGCCATT AT C AGATAGACAT TTTCTCATCT TTTTATTACT TGTATTTATG 37 8 0 

ACGTATCCAT TACATAAAAG TATACATTTA TTATTTTTCT TACCATATAG AAAATCGTTT 384 0 

15 

AAAGTTCATA AGTTAACTAA AAGAAAATGG CTTATATTCT ATAATACCTA CGTCAATCAA 390 0 

CCTGTACACA AATTTTATTT TTGCATTAAC TTAATATTGC CGTTAATTAT CTTATCTGCA 3 960 

^ ATGTTCGTTT ATCTAACAAT TTCATTCCCG CAATATGGAC ATTATTTTAT GTTCTTATTG 4 02 0 

GCATTGAATT TCGGTATTTC CATTACAGAT TTATTATATT TAAAAATAAT TATATTTTCT 4080 

AATTATGGAC AATATATAGA AGAACATAGT ACAGGTATTA ATATTTTGAA AAAAATTAAA 414 0 

2S AATCCATATC ATTTATAACA AAATAATTAT AG CAAGGTGT TATTATTTGT TTTTAGGCTA 420 0 

TGTAATAgcT tACAATCAAA TGTATATAGA CCTTGTTTTT TTATTTTCAT CAATTTCTAC 4 26 0 

CCCTAAACCT AATGCTCTAG TCTGATGTCA TGGGTTATTG ATTGGTGATA ATATAAAACT 4 320 

30 ATGTTATATT CACGATGATT AACTTACAAA GGAGTTT CAA CTATGAAGAT GATAAACAAA 4380 

TTAATCGTTC CGGTAACAGC TAGTGCTTTA TTATTAGGCG CTTGTGGCgC TAGTGCCACA 444 0 

GACTCTAAAG AAAATACATT AATTTCTTCT AAAGCTGGAG ACGTAACAGT TGCAGATACA 4500 

35 ATGAAAAAAA TCGGTAAAGA TCAAATTGCA AATGCATCAT TTACTGAAAT GTTAAATAAA 4 560 

ATTTXAGCTG ATAAATATAA AAATAAAGTT AATGATAAGA AGATTGACGA ACAAATTGAA 4620 

AAAATGCAAA AGCAATACGG CGGTAAAGAT AAATTTGAAA AGGCCCTTCA ACAG CAAGGT 46 8 0 

TTAACAGCCG ATAAATATAA AGAAAATTTA CGTACTGCTG CTTAT CAT AA AGAATTACTA 474 0 

TCAGATAAAA TTAAAATCTC TGATTCTGAA ATTAAAGAAG ACAGCAr GAA AGCTTCACAC 4 800 

4s ATTTTAATTA AAGTTAAATC TAAGAAAAGC GACmAAGAAG GCTTAGATGA TAAAGAAGCG 4 860 

AAACAAAAAG CTGAAGAAAT TCAAAAAGAA GTTTCAAAAG ATCCAAGTAA ATTTGGTGAA 4 920 

ATCGCTAAAA AAGAATCAAT GGATACTGGT TCAGCTAAAA AAGATGG CG A ATTAGGTTAT 4 980 

so GTTCTTAAAG GACAAACTGA TAAAGATTTT GAAAAAGCAC TATTTAAGCT TAAAGATGGT 5 04 0 

GAAGTATCAG AGGTTGTTAA AT CAAGCTTT GGATATCATA TTATTAAAGC TGATAAACCA 5100 
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AAAAATCCAA AATTATTGAC TGATGCATAC AAAGATCTAT TAAAAGAATA CGATGTTGAC 5220 

TTTAAAGATC GTGATATTAA ATCAGTTGTC GAAGATAAAA TCTTAAACCC TGAAAAACTT 52 8 0 

AAACAAGGTG GCG CACAAGG CGGACAATCC GGCATGAGCC AATAACACAA AACCGAGCGA 5 34 0 

CCGTGGTTCA AAAATCATAC CACGGCCGCT CGGTTTTTTC GCATTAAAAA TCGGACAGAT 5 4 00 

GAGCTCATGT TTCAGTATAC TCATCTGTCC GATATCTTTT AATTCTTAAT CGAGTGATTC 54 6 0 

AGGATTGTAG AATCTACGAT TTTCAAGACC AAATATTTTA TCTGTAAACT GACCCTTGTC 5 52 0 

AGTTTTTTTA TATGCCTTTT CAAACATATT CATTCTAGCA TCGATATTAT CGATATAGCA 5 580 

TAAAATTTCT GCTTCTTTTA AGTATGGCAG TTTTGGAGAA CCATACTCTA ACTTAC CATG 5 64 0 

ATGAGATAAA ATCATATGTC TTAACAACAT GATTTCTTCT CCTTCAATGT TCAATTCACG 5700 

AGCTGCTTCA ACTACTTCAT CACTCGCAAT CGAGATGTGT CCTAATAAGT TACCTTCGAC 5760 

TGTATACGAC GTCGCAACAG GACCACTCAA TTCTCTAACT TTACCAATAT CATG CAAAAT 5 820 

AATACCACTA TATAACAAAC TTTTGTTTAA CAATGGATAA ATGTCaCAAA TTGATTTTGC 5 8 80 

AATACGTAAC ATCGTTAATA CATGATAGCT TAAGCCACTC GCAAAGTTAT GaTGATGAGA 5 94 0 

ACTAGCAGCT GGATATGTGT AAAATCGTTC TTGATATTTT TTCAATAAAT GACGTGTGAT 6 0 00 

ACGTTGTAAA TTAGCATTTT CAATATCTAG CAAATAATGA GAAATCTCTT CTTGTATTTC 6 060 

TGCCGGTGAT AAAGGTGCAC CATCTACAAA TTGTTCTGTT TTTAATTGAT CTTCAGTTGT 612 0 

CGCTAGTCTA ATTTGGTTGA CTTTCATCTG TTTATTTC CG CGATAGTTTA TGATGTCACC 6180 

TTTAACATGT ACAATTTCTT CAGGCTTGAT TGTTGCCATA TCATTTTTTG TAGCCGTCCA 6 24 0 

AAATTTCGCT TCAATTTCAC CACTTTTATC TTGCAAATGT AATGTCATAT AATCTTTACC 63 00 

TTGTGCTGTT ACACCCTGTG TAGCTTTATG CACTAAGAAA AAGTGATCAA CTGAATCTCC 63 6 0 

GGGATTTAGA TTCTCTATAT TTCTCATCGT TTCCCGCCTT CCTCTATTTT GTTTAATGTA 6420 

ATCACTTCTT TTGATGGAAC AATATTATCT TTTACACATG TAAAGTATAG TACTTGATAG 64 80 

TGTTCTGATA ATGATCGTAA ATAATTCAAC ATTTTTTCAG TACGTTTTTT ATCAAAATGA 6 540 

ACAAATGCAT CATCAACAAT TAATGGGAAC GGATAATATG GTCTTAGTAC CTTAATTAAA 66 00 

CTGATACGTA AAGCTACATA AAGTAATTCT TTTGTAGATT GACTTAGTTC AACAGGATCA 6 660 

TATAATTGAC CATTAACATG TTTAACCGTA ATTGAATCTT CATTATAGTT AATCATCGTA 6720 

TATCTGCCAT CTGTTAAATG CTTCAATATT TCTACCGCTT CATTAATAAC TTGAGGCAAA 6 78 0 

CGTTTATCTT TAATTTGTTT AATGTGTTCA TCAACTAAAC TTTGTAAATA ACTTAAACTT 6 84 0 

GCCCAATCTT TTGCGATATC ATTAAGTTGA TTTTTAAGAC TGTGATATTC ATGTCTTAAA 6 90 0 
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GCTTGCATTT CAAGATATTG CTCATTATAT TCGTCAACTT GAGTAGCCAA TAAATGATCT 702 0 

TCTTCTTCAA GTTGTGCAGT TGTTTTTTCA CTTAAACTAG AACTTAATTC ATAAGAATAG 70 80 

S TTTTGGTTCT CAAGATATTT AGTTAAATCA TTAAAACGAC TCAAATTACT AGTATAAGTT 714 0 

TGGTAATCTT CATGATGTTG GTAAAAATCT TCTTCAGTAC CAACATTGAT AAAATCGAAT 72 0 0 

AGTGCTGTAA TTTCTTTATT ATTTTCTTCT AATTGAGCAT TTAAATGATT TAATTCATTT 72 6 0 

'° GTAACAAGTT TGGTATTTTC AGCATTAATA CGCCATTTTT CATTCGTGTC TTCAGCTGAT 73 2 0 

TTCAACCATT GTtGCACATC GTGGAATAAA GATAATTTGT TGAAATAAAC AAATTGTGAT 73 8 0 

TTTGTAACAG CTTCAGCATG ATTGTAGAAT GTATCTAATT CTTGAACCAA TTGCTGGCGT 744 0 

15 

TGTTGATTTA AATCACTGAT ATGTTGATCT AATGCTTTAA TATTCGCCAT TGTAGAAATA 7500 

CTATCAACAA TTAAATCATT TGAAATTTTA GATGATAAGT ATAATTCATC CTTAACGTTC 756 0 

2o TCAACTGTCG ATTGTAATTC ATCATGACGC CCTTTCGCAT CATTTAAACG ACCTTCAATA 762 0 

TACTGACGTT TCTCTTCTAA AATATCTTTA TTTTTCAAAG CTTGTTGCCA GTGATCACGA 76 80 

ATGCGATATT GCTCATCAAG ATCAAAATCT AAGTCATAAT TTTCATCTAA AATGGCTAGT 774 0 

25 TGTGCTTTAA TTTCTTCGAT TTCATCTGTG ATGGCCTCGC TATAAT CTAC TTCTTTTGAT 7800 

TTAGACATGA TGATACCGAT AACAAATACT AAAGTTAATA CTG CGAAAAT AATACCAAAC 7860 

AACATGTTGT TTGAAATAAA TGAGAAGGCA GTTAAACCAA TACCTACTAA TGTTAAAAG r 792 0 

30 ATAAACGTTG TTCGkAACAA TTTTTGACGT TTTTGttTTT CTT 7963 

(2) INFORMATION FOR SEQ ID NO: 16 9: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 3 95 8 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
r (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 169: 

ATATTGTCTT TACAATAGTT TGCTATGGAG GTAATTAACC AATAGGAGGA ATTTATAATG 60 

4s GCAGTAATTT CAATGAAACA ATTACTAGAA GCGGGTGTTC mCttCGGTCA CCAAACACGT 120 

CGTTGGAACC CAAAAATGAA AAAATATATC TTCACTGAGA GAAATGGTAT TTATATCATC 180 

GACTTACAAA AAACAGTGAA AAAAGTAGAC GAGGCATACA ACTTCTTGAA ACAAGTTTCA 24 0 

SO GAAGaTGGTG GACAAGTCTT ATTCGTAGGA nCTAAAAAAC AAG CACAAGA AT CAGTT AAA 3 00 

TCTGAAGCAG AACGTGCTGG TCAATTCTAC ATTAACCAAA GATGGTTAGG TGGATTATTA 36 0 
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GAAGATGGTT TATTCGAAGT ATTACCTAAA AAAGAAGTAG TAGAACTTAA AAAAGAATAC 4 80 

GACCGTTTAA TCAAATTCTT AGGCGGAATT CGTGATATGA AATCAATGCC TCAAGCATTA 54 0 

5 TTCGTAGTTG ACCCACGTAA AGAGCGTAAT GCAATTGCTG AAGCTCGTAA ATTAAATATT 600 

CCTATCGTAG GTATCGTTGA CACTAA CTGT GATCCTGACG AAATTGACTA CGTTATCCCA 6 60 

GCAAACGACG ATGCTATCCG TGCGGTTAAA TTATTAACTG CTAAAATGGC AGATGCAATC 720 

10 

TTAGAAGGTC AACAAGGCGT TTCTAATGAA GAAGTAGCTG CAGAACAAAA CATCGATTTA 78 0 

GATGAAAAAG AAAAATCAGA AGAAACAGAA GCAACTGAAG AATAATCAAC TGTTGAATCT 84 0 

GACTTAGATA TAGTTTAAAT GGGTGATAAG ATATTAATGC TTATCACCTT TTTTAAAAAG 9 00 

IS 

AAAATCGAGG CAAATTACAA ATATTCAATT AGAGTATTGG CAATCTTGCC TATAATAATG 960 

CTAAAATCAT AATATATAAn ATGATAACTT ATTGGAGGAA TAATGAATGG CAACTATTTC 102 0 

20 AGCAAAACTT GTTAAAGAAT TACGTGAAAA AACTGGCGCG GGTATGATGG ATTGTAAAAA 10 8 0 

AGCGCTAACT GAAACTGATG GTGACATCGA TAAAGCGATT GACTACCTAC GTGAAAAAGG 114 0 

TATTGCTAAA GCAGCTAAAA AAGCAGACCG TATTGCGGCT GAAGGTTTAG TACATGTAGA 12 0 0 

25 AACTAAAGGT AACGACGCAt TATCGTTGAA ATCAACTCTG AAACAGACTT TGTTGCTCGT 126 0 

AACGAAGGTT TCCAAGAGTT AGTTAAAGAA ATCGCTAATC AAGTATTAGA TACAAAAGCT 132 0 

GAAACTGTTG AAGCTTTAAT GGAAACAACT TTACCAAATG GTAAATCAGT TGATGAAAGA 13 8 0 

30 ATTAAAGAAG CAATTTCAAC AATCGGTGAA AAATTAAGTG TTCGTCGTTT TGCTATCAGA 144 0 

ACTAAAACTG ATAACGATGC TTTCGGCGCT TACTTACACA TGGGTGGACG CATTGGTGTA 150 0 

TTAACAGTTG TTGAAGGTTC AACTGACGAA GAAGCAGCAA GAGACGTTGC TATGCATATC 156 0 

35 

GCTGCAATCA ACCCTAAATA TGTTTCTTCT GAACAAGTTA GCGAAGAAGA AATCAACCAC 162 0 

GAAA3AGAAG TTTTAAAACA A CAAG CATTA AATGAAGGTA AACCAGAAAA CATCGTTGAA 16 8 0 

AAAATGGTGG AAGGACGTTT ACGTAAATAC TTACAAGAAA TTTGTGCTGT AGATCAAGmT 174 0 

40 

TCGTTAAAAA CCCTGATGTA ACAGTTGAAG CTTT CTTAAA AACAAAAGGT GGAAAACTTG 18 00 

TTGACTTCGT ACGCTATGAA GTAGGCGAAG GTATGGAAAA ACGCGAAGAA AACTTTGCGG 1860 

45 ATGAAGTTAA AGGACAAATG AAATAATCTG TCATAAAGTA AAACAAGGAA GAAGACACCT 192 0 

TTAATGTTGC TTTATTAAAA TGTAAAT CAT TCTAATAAAA CGACAACTGT GTCTTCTTTA 198 0 

CTTGTATATG TTACATATAT TCACGATAGA GAGGATAAGA AAATGGCTCA AATTTCTAAA 2 04 0 

SO TATAAACGTG TAGTTTTGAA ACTAAGTGGT GAAGCGTTAG CTGGAGAAAA AGGATTTGGC 2100 

ATAAATCCAG TAATTATTAA AAGTGTTGCT GAGCAAGTGG CTGAAGTTGC TAAAATGGAC 216 0 
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TTAGGTATGG ACCGTGGAAC TGCTGATTAC ATGGGTATGC TTGCAACTGT AATGAATGCC 22 8 0 

TTAGCATTAC AAGATAGTTT AGAACAATTG GATTGTGATA CACGAGTATT AACATCTATT 234 0 

GAAATGAAGC AAGTGGCTGA ACCTTATATT CGTCGTCGTG CAATTAGACA CTTAGAAAAG 24 0 0 

AAACGCGTAG TTATTTTTGC TGCAGGTATT GGAAACCCAT ACTTCTCTAC AGATACTACA 24 6 0 

GCGGCATTAC GTGCTGCAGA AGTTGAAGCA GATGTTATTT TAATGGGCAA AAATAATGTA 2 52 0 

GATGGTGTAT ATTCTGCAGA TCCTAAAGTA AACAAAGATG CGGTAAAATA TGAACATTTA 2 58 0 

ACGCATATTC AAATGCTTCA AGAAGGTTTA CAAGTAATGG ATTCAACAGC ATCCTCATTC 2 64 0 

TGTATGGATA ATAACATTCC GTTAACTGTT TTCTCTATTA TGGAAGAAGG AAATATTAAA 2700 

CGTGCTGTTA TGGGTGAAAA GATAGGTACG TTAATTACAA AATAAATTTA GAGGTGTAAA 2 760 

ATAATGAGTG ACATTATTAA TGAAACTAAA TCAAGAATGC AAAAATCAAT CGAAAGCTTA 2 82 0 

TCACGTGAAT TAGCTAACAT CAGTGCAGGA AGAGCTAATT CAAATTTATT AAACGGCGTA 2 88 0 

ACAGTTGATT ACTATGGTGC ACCAACACCT GTACAACAAT TAGCAAGCAT CAATGTTCCA 2 94 0 

GAAGCACGTT TACTTGTTAT TTCTCCATAC GACAAAACTT CTGTAGCTGA CATCGAAAAA 300 0 

GCGATAATAG CAGCTAACTT AGGTGTTAAC CCAACAAGTG ATGGTGAAGT GATACGTATT 3 06 0 

GCTGTACCTG CCTTAACAGA AGAACGTAGA AAAGAG CGCG TTAAAGATGT TAAGAAAATT 312 0 

GGTGAAGAAG CTAAAGTATC TGTTCGAAAT ATTCGTCGTG ATATGAATGA TCAGTTGAAA 3180 

AAAGATGAAA AAAATGGCGA CATTACTGAA GATGAGTTGA GAAGTGGCAC TGAAGATGTT 324 0 

CAGAAAGCAA CAGACAATTC AATAAAAGAA ATTGATCAAA TGATTGCTGA TAAAGAAAAA 3300 

GATATTATGT CAGTATAAAA CTAATATACA ATGACATATT AAAATGCCAG TATTAAACGA 3360 

TAATGTAACA TTTAAAATGG GCATGTTTAA TTAAATCAAA GATGCATGTG ATAATTTAAA 34 2 0 

TTCAGAATGA GCATAAAAAT GGTGTTTAAA CAAGTTAATT AAACATATAC TTTATAAATA 34 8 0 

ATAGGCATTA GGTATATTGC TATAATAAAG TTATGTAATT TTTAACCTCA GTATGTATGT 3 54 0 

CACATTTCTG GTGTAAACTG TACCGAGTCA GACTTTGGTA CAGTTTTTTT ATTTGCTTAT 3 6 00 

TCAATG CATT AAATGAGTAT GATAAAATGA TAATGATTGT TTAGTAACTT ATACTATATG 36 6 0 

ACAGAGATGA TCAGGCTCGG AGGAAAGACC ATGTTTAAAA AG CT AAT AAA TAAAAAGAAC 3720 

ACTATAAATA ATTATAATGA AGAATTAGAC TCGTCTAATA TACCTGAACA TATCGCTATT 3 780 

ATTATG GATG GTAATGGGCG ATGGG CTAAG AAGCGAAAAA TGCCTAGAAT TAAAGGTCAT 3 84 0 

TACGAAGtAT GCAAACAATA AAAAAAATTA CTAGGGTAGC TAGTGATATT GGTGTTAAGT 3 9 00 

ACTTAACTTT ATACGC C T TT TCCACTGAAA ATTGGTCAAG ACCTGAAAGT GAAGTAAA 3 9 58 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5 3 33 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 170: 

10 

ATTAAAACAA CTTAATATAC CTATTTATGG TGGTCCTTTA GCATTAGGTT TAATCCGTAA 60 

TAAACTTGAA GAACATCATT TATTACGTAC TGCTAAACTA AATGAAATCA ATGAGGACAG 120 

TGTGATTAAA TCTAAGCACT TTACGATTTC TTTCTACTTA ACTACACATA GTATTC CTGA 180 

IS 

AACTTATGG C GTCATCGTAG ATACACCTGA AGGAAAAGTA GTTCATACCG GTGACTTTAA 24 0 

ATTTGATTTT ACAC CTGTAG GCAAACCAGC AAACATTGCT AAAATGGCTC AATTAGGCGA 300 

20 AGAAGGCGTT CTATGTTTAC TTTCAGACTC AACAAATTCA CTTGTGCCTG ATTTTACTTT 3 60 

AAGCGAACGT GAAGTTGGTC AAAACGTAGA TAAGATCTTC CGTAATTGTA AAGGTCGTAT 4 20 

TATATTTGCT ACCTTCGCTT CTAATATTTA CCGAGTTCAA CAAGCAGTTG AAGCTGCTAT 4 80 

25 CAAAAATAAC CGTAAAATTG TTACGTTCGG TCGTTCGATG GAAAACAATA TTAAAATAGG 540 

TATGGAACTT GGTTATATTA AAGCACCACC TGAAACATTT ATTGAACCTA ATAAAATTAA 6 00 

TACCGTACCG AAGCATGAGT TATTGATACT ATGTACTGGT TCACAAGGTG AACCAATGGC 6 60 

30 AG CATT ATCT AGAATTGCTA ATGGTACTCA TAAGCAAATT AAAATTATAC CTGAAGATAC 720 

CGTTGTATTT AGTTCATCAC CTATCCCAGG TAATACAAAA AGTATTAACA GAACTATTAA 78 0 

TTCCTTGTAT AAAGCTGGTG CAGATGTTAT CCATAGCAAG ATTTCTAACA TCCATACTTC 84 0 

35 

AGGGCATGGT TCTCAAGGTG ATCAACAATT AATGCTTCGA TTAATCAAGC CGAAATATTT 900 

CTTAeCTATT CATGGTGAAT ACCGTATGTT AAAAGCACAT GGTGAGACTG GTGTTGAATG 96 0 

CGGCGTTGAA GAAGATAATG TCTTCAT CTT TGATATTGGA GATGTCTTAG CTTTAACACA 1020 

40 

CGATTCAGCA CGTAAAGCTG GTCGCATTCC ATCTGGTAAT GTACTTGTTG ATGGTAGTGG 10 80 

TATCGGTGAT ATCGGTAATG TTGTAATAAG AGACCGTAAG CTATTATCTG AAGAAGGTTT 114 0 

45 AG TTAT CGTT GTTGTTAGTA TTGaTTTTAA TACAAATAAA TTACTTTCTG GTCCAGACAT 12 0 0 

TATTTCTCGA GGATTTGTAT ATATGAGGGA ATCAGGTCAA TTAATTTATG ATGCACAACG 12 6 0 

CAAAATCAAA ACTGATGTTA TTAGTAAGTT AAATCAAAAT AAAGATATTC AATGGCATCA 1320 

50 GATTAAATCT TCTATCATTG AAACATTACA ACCTTATTTA TTTGAAAAAA CAGCTAGAAA 13 80 

ACCAATGATT TTACCAGTCA TTATGAAGGT AAACGAACAA AAAGAATCAA ACAATAAATA 144 0 
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GCTTTTTCTT TATATATGAT GAGCTTGAGA CATAAATCAA TGTTCAATGC T CTA CAAAGT 15 6 0 

TATATTGGCA GTAGTTGACT GAACGAAAAT GCGCTTGTAA CAAGCTTTTT TCAATTCTAG 16 2 0 

5 TCAGGGGCCC CAACATAGAG AATTT CGAAA AGAAATTCTA CAGGCAATGC GAGTTGGGGT 168 0 

GTGGGCCCCA ACAAAG AG AA ATTGGATTCC CAATTTCTAC AGACAATGTA AGTTGGGGTG 1740 

GGACGACGAA ATAAATTTTG AGAAAATATC ATTTCTGTCC CACTCCCGAT TATCTCGTCG 18 00 

10 CAATATTTTT TTCAAAGCGA TTTAAATCAT TATCATGTCC AATCATGATT AAAATATCAC 186 0 

CTATTTCTAA ATTAATATTT GGATTTGGTG AAATGATGAA CTCTTTGCCT CGTTTAATTG 1920 

CAATAATGTT AATTCCATAT TGTGCTCTTA TATCTAAATC AATGATAGAC TGCCCCGCCA 1980 

15 

TCTTTTCAGT TGCTTTCAAT TCTACAATAG AATGCTCGTC TGCCAACTCA AGATAATCAA 2 04 0 

GTACACTTGC ACTCGCAACA TTATG CGCAA TACGTCTACC CATATCACGC TCAGGGTGCA 2100 

zo CAACCGTATC TGCTCCAATT TTATTTAAAA TCTTTGCATG ATAATCATTT TGTGCTTTAG 2160 

CAGTTACTTT TTTTACACCT AACTCTTTTA AAATTAAAGT CGTCAACGTA CTTGATTGAA 2220 

TATTTTCACC AATTGCCACA ATGACATGAT CAAAGTTACG GATACCTAAA CTTTTCATAA 22 80 

25 CTGCTTCATC TGTAGTGTCT GCAACAACCG CATGAGTAGC GATATCACTA TATTCATTCA 234 0 

CTCTATTTTC ATCATGGTCG ATGGCCATTA CATCCATGTC TAATGCATTC AACTCACGAA 24 00 

CGATACTACC TCCAAAACGA CCTAGACCGA TGACTA CAT A TTCTTTACCC ATACTCGCCC 24 6 0 

30 TCCATTAAAT GATTTTCATC AATTCATTGA AAATATAAAT TTAAAATTAT TATAAATGAG 2 520 

TACCCCAACT AAATTATCTA AATGCAGTAA TGCAAGTAAA TGAAAGTTGG GGTATCGTCT 258 0 

CAACTTATGA TTTCTTTCCT TCAACATATT CTTTGTC GAA AACAAATAAT CTTAATAATA 2 64 0 

35 

ATATTAACGA TGGAAGTAAT AAAAGTAAAC CTAAAATAAA GACAATCACT AATGTCCAGC 270 0 

CCATTTCTGG ATTAACATAT GCATCTGTAA TTTTTACAAA CGGATATAAA AGGTATGGCA 2 760 

ATTTACTAAT TCCATAGCCA AAGAACGCGA ACATCATTTG TAAAATAACA AATACAAAAG 2 820 

CCAAACCATG TTTTTTCTTA AAGAATGTTA ACAATGAAGC TAATGCAAAG AATAAGAAAC 2 880 

TTATACCAAA CATCCACCAA TAGTCAAAAA CAGCTGAATA AAAATGTTCA GAATTTTGAA 2 94 0 

45 TGCGTAATGA TAGAAATACG AATAAACAAA TGATAATCAT CGGCGGCCCT AAAAATATGT 3 000 

GCCATTGTCT TGTTAAATTA TATGCTGGTT CGTCATTTGC TTTTTTAGCA TAATATGTCA 3 06 0 

AAAATCCTGA TGAAATATAT AAAACTGAAA TAATTGCCAA GAATACTACA GACCAAGCAA 312 0 

SO ATGGG CTTAA TAATAACTGC ACCCAATCTA GATCGATAAC ATTGTTTCGA ACATTAATAT 3180 

AGCCACCTTC TGTAATAGTT AAAGCAGTAG ATAATGAAGC TGGAATTAAT AATCCACTTA 3 24 0 
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AACTG TTTCT CAACGATATC ATAATCAGTG CTATTGAACC TGGTATTAAC AATACCGTGC 336 0 

CTAAATATTT GATTGACTCT GGAAAGAAAC CTACGAATCC TACGAAGAAG AAAACAAAGA 34 2 0 

5 ATACATTCGT AACTTCCCAA ACTGGGTTTA AATAACGTGA AATTAAGTGA TTAATTTTCT 34 8 0 

TTTCATCACC AGTTAACTTT GAATGCAATG CGAAGAAACC TGCCCCAAAA TCTATAGAAG 3 54 0 

CAATAATGAT ATAG CAAAAT AAAAACAACC ATAACACTGT TATACCTATA AATGCATAAA 36 00 

'° TCATTTTTCT ATTTCTCCTC CTTGCTTCTT GGCTAAACGA TTTACATCTT CATACGCCGG 3 660 

TTTATTTTTA AACATACGAA TTAATACGTA TGCACATGTA TACATTAAAA TGATGTACAA 372 0 

TATGCCAAAT AAAATTGTAA CGAaGGTTAT TCCGCCTGCT TGTGTTGCTG CTTCTGCCAC 37 80 

15 

GCGCATATAA CCACGAACAA TCCAAGGCTG TCTACCCATC TCTGTTAAGA ACCATCCAAA 384 0 

TTCTATAGCT AGCATTGAAG CTGGGCCTGT TAATAATATT CCATAAAGCA TCCATTTATG 3 9 00 

2o AGTAGAAAAC TTTCTAAGCT TTTTAAACAT TAAAGTTAAG ACATAAACAC CTGAAATGAC 3 960 

AAAACATAAA ATTCCCATCG TTACCATTAA ATCAAAGAAA TAATGGACGA TCATAGGCGG 4 020 

ATGTAAACTT TTTGGAAAAT CATTTAACCC TTGTACTTTA GTTTTGACAC TATTATCTGC 4 080 

25 TAAGAAACTC AATAGTCCAG GTAATTCAAT CGCACCTTTA ACTTGCTGAG TCTTTTCATC 414 0 

TAACACACCA AATAATAATA ATTTGGCATG GGAAGATGTA TCGAAATGCC ATTCATAAGC 4 200 

TGCTAATTTT TCAGGTTGGA ATTTATGCAA AAATTTTGCA GATAAATCCC CTGCCAACAT 4 260 

30 AGAAAGTAAT GTTGAAAAGA ATCCAACTAT CATAGACATT TTCAAAGCTT TCTTATGGTA 4 320 

GACAGTATCT TTAGGTTGAC GATTACGCAA TAATTTAAAA GCTGCTATTG ATGCAATAAC 4 3 80 

AAATGCCATC GTCATACCGG CTGTAGTAAT TACGTGAAAT GATCGAACTA TAAACGATGG 444 0 

35 GTTAAACATC GCTTCTATAG GTTGAACATT GACCATCTTT CCATTCTTCA ACTCAAAACC 4 5 00 

TGCAGGCGTA TTCATAAATG AATTCACTGA AGTAATGAAG AATGCTGAGA AAGAGCCACC 4 560 

AATAATTACT GGTATACTAA TTAAGAAATG TGTCCATTTA TTTTTAAAAC GATCCCAAGT 4 62 0 

ATATAAATAT ATACTTAAGA AAATAGCTTC AAAGAAGAAC GCAAATGTTT C CAT AAATAA 4 680 

TGG AAGTG CA ATAACGTGTC CACCCATTTC CATAAATGTA GGCCAAATCA ATGATAATTG 4 74 0 

4S AAGTCCTATA ATTGTAC CTG TAACAACTCC CACTGCTACA GTAATTGTAT AAGCTTTAGC 4 800 

CCATCTTTTG GCCATAGCTA TATATTGAAG ATCATTTTTG CGAATACCTA AAAATTCTGC 4 860 

AATTGCGAAC ATTAAAGGCA TACCAACACC AATCGTTGCA AAAATGATAT GAACTGCTAA 4 92 0 

SO AGTCATAGCT GTCAAAAACC GACTGATTTC AACTGTATCC ATTTAAAAAC AT CACCTTTT 4 9 80 

TCTTTTTTTG ATGACAACAC AATGAACTTA ATTATAATTG CTATAATGTG TATTTTTAAA 504 0 
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GAATTTCAAT GTATAATTGT GTATATTACA TTAGAATAAA GCACGAAGGA GCATGATACA 
TGTCAGAAAT AATCGTTTAT ACGCAGAATG ATTGTCCACC TTGTACATTT GTAAAAAATT 
ATCTAAATGA GCATCACATT GATTTTGAAG AGAGAAATAT CAACAATCAA CAATATCGAA 
ACGAAATGAT AGATTTTGAT GCTTTTTCAA CTCCGTTTAT TTTGTTGAAT GGC 
(2) INFORMATION FOR SEQ ID NO: 171: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11126 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY; linear 



5160 
5220 
5280 
5333 



(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 171: 

ATACGTGACC CTTTATCCGA AAATTTCTTT TCATATTCTG TTAAAATATT ACTGCCATCG 6 0 

TCTTCTTGAT GTAAATTTAG ATTTATTTTT GTAAAATACA TTCCAAATTG AGACATACTT 12 0 

TCTAAACTGT AGGCAAATAG TCCTCTGTTA TCAGTTTTAA AATGTAAATC TCCTTCATCA 18 0 

TTTAAGATTT GTTGATACAA CGCTAAAAAC GTATGATACG TTAAACGTCG TTTTGCATGA 24 0 

CGATTTTTTG GCCATGGATC TGAAAAGTTC AAATAAATAC GCGAAACTTC GCCGTCTTTA 30 0 

AAATATTCAT TTAATTCAAT GGCGT CATTA CAAATAATCT TTAAATTTGT TAAACCCATC 360 

TCTTTAACTT TATCCAATAC TTTATAAACG ATACTTTTCT CACGTTCCAT TGAAATATAG 42 0 

TTAATATGAG GATTTTG AG C AGCTAATGTT GTAATAAACT GCCCCATACC CGAACCAATT 4 80 

TCAATGTGTA TCGGTTGCGT TTTaTCAAAC CATTCAGTCA TTTTCCCTGc ATGTTGACCG 54 0 

TCCATGTCAA CCAATTCAGG ATGATCTTTT AAATAATCTT CAGCCCATGG TTTGTATCGA 6 00 

ACTCTCATAT TTTATTCTCC TCTTAAATAA ACATGTTACT ATTCATAACT TCATTTAGGA 66 0 

ATTTAAGCCA AGTGTTCATA TCCTTATATC TTTTTTGCTC TTCATACCAT TGAACAAGAC 720 

CTATAGATTG AATTAC CGT A TACCATTTCA TACGTTTATT TAAATTCAAG CTCTCTTGAA 780 

CACCATATGT TTCAAGCCAT TCAGACCATT GTTGTTGTGG AACATAGTTG TAAAGCAGCA 84 0 

TTCCGATATC AATTGCCGGG TCTGCAATCA TTGCACCTTC CCAATCAACT AAAAATAGTT 900 

CATCTCGATC GGATAATAAC CAATTATTAT GATTCACATC ACCATGTACA ACAGTGAAAA 960 

AACGCGAATC TAAACTCGGT ATATGCTCTT CTAAATAGGT TAATGATTTT CTCACAATAT 1020 

GATGTGTTAA AACTTCTCTT GATAAAGAGG CATTAATTTT ATTAAGCATA ATCTCAGGAG 1080 

TAATAGGTTC CATTTCCATA CGCTTTAACA TACTTAATAA AGGTCTAGAA TTGTGTATCT 114 0 
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TTTTCCAATG TTGTGCTGTA ACAACCTCGC CTGTTTCTAT GCGTTTCGTC CATACTAATT 126 0 

TGGGCACAAT ACCTTCTGCT GATAATGCCG CAATAAATGG ATTTGAATTT CGTTTTAAAA 132 0 

ACAACTTTTG TCCATCTTGT TCAGCCATAT ATGCTTCACC AGATGCACCA CCTGCTGAAT 13 8 0 

CAAGTGTCCA CCCTAATTGA TAAAACTGCT CCAACTCGTC CACCTCACTT TCAATTAGAA 144 0 

AATGGCTCTA GAAATAGGTT TTTCAAGAG C CAT AT ATT CT AATTTATAAC ACCATACTGG 150 0 

TACAAATATT ATGTCCAGAT AATTATTGTA AATCCTCAAC CAATGCCTAC ATTA CACGAC 156 0 

TAAATTTAAA TCGTAATGTC TGTCATTGAC ACCATACATT CTATAGTCAC TTACTTGACA 1620 

TATAATGTTA CCGTGTCTAA AACTACATGT TTTTGAATCT CTGTAGGCGA TAAACTcTAG 168 0 

TTTTCAAAAT AATTGCTATC CCATTTTCAT GGTTAGCATA AATTTATGAA CTGTAACATT 174 0 

TACGTACTTA GTAAAATATG ATGCACATCA TATTTGTrAC TCATAGAAAA TTTTATAAt T 1800 

TTTATCATTA TATTTCAACT GAAAATGAGA AACAAAATGG CA C T TT TTAC TAATATGTGT 1860 

TTTCTAAACA ACACTTTTAA GCTTCGTTTT AAATTATAAC ATAATTCACT TACGAAAGTT 192 0 

GATAAATTTA AGTAATTTAA TCTAAAAATA TGATGAAAGA ATTTTAAATA CTGTGTGACT 1980 

CTATATACTT TTCAAATCCT T CTTGTAGTT GACGTGTAAT TGGGCCAACT TTACCATCAT 2 040 

TAACTGGTT C ACCATCTAAT TTAATAACAG GTGTAACCTC AG CTGAAGTA CTTGAAACAA 2100 

TAACTTCATC TGCGTTTTTC AAGAAAT CTA CAGTAAACGT TTCTTCTTTA AATGGGATGT 2160 

TATAGTCTTC GGCAATTTTT TTAATTACAA TTCGTGTAAT ACCATTAAGA ATATAGTTGT 22 20 

TAATCGGATG TGTATAAATC ACACCGTCTT TAATTGCATA AGCATTACTT GAAGATCCTT 22 80 

CAGTTACAGT TtCACCTCGA TGTTGAATTG CTTCAACTGC ATTATATTTC ACAGCATATT 234 0 

CTTTTGCTAA TACATTcTCC TAATAAGTTC AAGCTTTTAA TGTCGCAACG TAACCATCGG 24 0 0 

ATATCTTCAA CGGTAACACC ATTCACACCA TTTTCTAAAT GATCATAAGG ACGATCATAA 24 6 0 

CTCTTTGTAT AAGCAACAAT TGCTGGTTCT ACTTCAGGTG TCGGGAAGCT ATGATTCCTT 252 0 

TCAGCTACAC CACGCGTTGC TyGAATATAA ATTGCCCCAG TTTCAATTTG ATTCATATCA 258 0 

ACTAATTTAC GAGATAGTTC AATTAATT CT TCTACAGAAT AATTTAAATC TAAACCAATC 264 0 

TCATTGGCAC TACGTwAAAw TCTTTCATAA TGTTCTGTTA CTGTAAATAA CTTAC CATT A 270 0 

TATACTCGAA TGTATTCATA AATACCATCG CCAAATACGT ATCCTCTGTC GTTGTATGAA 276 0 

ACCTTTGCTT CACTTGGACT TACAAACTCA CCATTTAAAA AAATTTTTTC CATATATTAT 2820 

TCCTCCACGC ATAATGAATA AATTGCTTCT AAGTAAATAC TAGTTGCGTT AAATAACTGT 288 0 

TTTTTAGTGA TATATTCATT TTTCTGATG C ATTAAATCTT CAGAATCACT AAACATTGCG 2 94 0 
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TCAGTCATAT CATTTGTTTG ATTTCTATAT GCAGTAACTA ACTTTTGTAC AAAAGGATCA 3 06 0 

TTTTTATCAA CATAATGTGG TGGTTGGACT TTAC CTAATT TCACTTCAAA GCCATATTGT 312 0 

5 TGAATCTCAT TTGCAAAACG ATCCATAGCT TTTTCAAATT CAAATCCTTC TGGGTAGCGT 3180 

AAGTTGATAC CGAAAAGACC TGCGTTTTCA TTATCATATG TAATAACACC AATGTTAGTT 324 0 

GTCACGTCAC CCATGACATC TGTATGGAAT TTCATTCCCA TCTTTTCACC AAAATCTGAA 3 3 00 

10 

TTAAATAAGT AGCGATTACT AAATGCTACA AACGCTTGTG CATTATTATC AAGATTTAAT 3 360 

GATGCTAAGA ATTTTAGTAA GTAAAGACCC GCATTCACAC CGATAGATGG ATCCATACCA 34 2 0 

TGAACCGCTT TACCTTCAAC TGTTAAAACT AGAATGCCAC TATCAACAGT ACTATCACCT 34 8 0 

15 

TGTAAATGAT TTTGTTCTAA AAAGTACTCA AAGTCTTGAA TAACATCTGT CATATTTTCT 3 54 0 

TTAACAAGCA CTCTTGCTTC TGCATGATCA GGTACCATGT TGTAACGTTC AC CAGATTTA 3 6 00 

20 AAAGTTATTA ATTCATAATC AGGTTCATCT TGATCTTCAG TAAGTTTATT TTGAACTAAA 3 66 0 

TCAAATGTTG TAATGCCTTT TTCAC CATGA ATACATGGAA ATTCTGCATC TGGTGCAAAA 3 72 0 

CCTAATGTTG GCATTTCTTC TGTTTTAAAA TAGCGATCCG TACATTTCCA AT CAG ATT CT 378 0 

25 TCATCCGTAC CAATAATCAT ATGAATACGT TTCTTCCAAT CCACATTCAT ATCTTCTAAT 3 840 

ATCTTAATTG CATAATAAGC AGCAATTGTT GGACCTTTGT CATCAAGTGT ACCTCTAGCT 3 9 00 

ATGATAG CAT CTTCTGTTAC AACCGGCTCG AACGGATTAC TATCCCATCC ATCACCAGCA 3 96 0 

30 GGAACAACGT CAACATGACA TAAGATACCT AATACGT CAT TTCCTTTACC TGCCTCAATT 402 0 

CTTCCTGCAA TATGATCCAC ATCATGTGTT GTAAATCCAT CTCTATGTGC AATTTCATAC 4 080 

ATGTAGT CT A ATGCCTTACG AGGACCTGGA CCAACTGGTG CGTCTTCTGA TGCTTTTGCA 414 0 

35 TCATCTCTCA CACTTTCAAT TGCTAATAAT CCTTTTAAGT CATTAATGAT TTGATCTTCG 42 00 

TATTGTTGAA CTTTTTCTTT C CACATTCG A AATCGACTTC CTTTTTTCTA TAAGTTAAAT 42 60 

TCTATTTTAC ATGAAAAGAT ATAAAAACTA CAATAAGATG TCAGAAAATA ATAAAAAGGA 4 3 20 

40 

ACAAAACGAT GCTATTGATA TGACACAAAT CATAAATAGC TGCTTTGTTC CTTTTTTAAT 43 80 

TTATATATTT AAAATACACA TATTCAAGAG CTCGAGATAT AAGTCAATGT ACTAGGCACA 444 0 

45 CAATTTAATA TTGACAGTAA TTAACCGAAC GAAAATGCGC CCCGGGGCCC CAACATAGAG 45 00 

AATTTCGAAA AGAAATTCTA CAGACAATGC AAGTTGGCGG GGCCCCAACA TAGAAGCTGG 4 56 0 

C CAATAG TTA GCTTTCAATA ATGTGCAAGT TGGGGTAAGG GCCCCAACAC AGAAGCTGGC 462 0 

s ° CAATAG T CAG CTTTCAATAA TGTGCAAGTT GGGGTAAGGG CCCCAACACA GAGAATTTCG 46 80 

AAAAGAAATT CTACAGACAA TGCAAGTTGG CGGGGCCCCA ACACAGAAGC TGG C CAATAG 4 74 0 

55 
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TAAAGAAATA CGTTTT CTTT AGATATTAGT ATTTCTTATG AATGAGTTTC ACGCATGTAT 4 86 0 

TCTTCTTTCT ATATG CAT AT TAGCTATGAC TAACGATAAA GAACCTGAAA CACTAATAAA 4 92 0 

TGTCCTATAG TTTACAATAT TATATTGGCA GTAGTTGACT GAATGAAAAT ACGCTTGTAA 4 98 0 

CAAGCTTTTT TCAATTCTAG TCAACCTTGC CGGGGTGGGA CGACGAAATA AATTTTGCTA 504 0 

AAATATGATT TCTGTCCCAC TCCCTTATCA TTTCTGTCCT ACTCA CATCT TATTCTTTAT 510 0 

CAGATAATGC ATTTTTATTC TTTTTTAAAT CTTCTTCAGT GACGATACGT AAATTATTAT 5160 

TTGGTGTGCG CCACCTTCAT CATCAAATTT AC CTTTTTCA ATACTTTCGT CAGTCTTATT 522 0 

GTCATATTCG GTAAATTTTG ATTTTTCTTC TTTGAAAAAT GCTTTTGGAT TATTTTTTAA 5280 

TCTATTAGCA TATTCTTTCG GATTTGTTTT TACTTCTTTA ATTGTTTCAT TAGCAATTGT 534 0 

TCCTAATTGC GTCGCTTTAT CCTTAG CATT ATCTTTATAG CTTTGAGGAT CTTGTTTATA 54 0 0 

TTTATTATAT TCcTGcTTTC AGCTTGTCAC GACTATCTTT ACGTGTAACA AGTACAG CTG 54 6 0 

CTACAGCGCC ACCTATACCT AAAATCGCTT TAAATAAATT ACCTTTTGCC ATATCAATCG 5520 

TCTCCCTTTT ATTTATAATT TAATTTGTCA AAATCATTTT CAGTTAATAA ACGATATTCT 5580 

CCTGAATCTA AATTGCTGTC CAATTCTAAA TCAGCAATTT TGATACGTCT TAAATGTAAT 564 0 

ACCTCATTTT GAATGCTATG AAACATTCGT TTAACTTGAT GATATTTTCC TTCATAAATT 570 0 

GTTACGTGTG ACGTTTGATT ATCAATATAA GTTAATATTG CAGGCTTAAC CTTGCCATCA 576 0 

GTCAGTGTtA CACCCTCTTT AAAAGCTTGA ATGTCGTCTT CAGTGATAGG ATTTGCTGAA 5 82 0 

ATAACTTCAT ATTTTTTAGA AACATGTTTG TTTGGACTCA TTAATTCATG ATTAAAATCA 5880 

CCATCATTCG TTATCAATAA AAGCCCTTCT GTATCTTTAT CAAGACGACC AACCGGAAAA 5 94 0 

ATATTTAGAT GTTGGTATTC AGGTATTAAA TCAATAACGG TTTTTGAATG ATGATCTTCA 6 000 

GTTGCTGATA TATAACCTTT TGGCTTATTT AACATAATAT AGACATTTTC AATGTATTCT 6 06 0 

ATTAATTCTC CACGAACTGT TATCTTATCG TTTTCTGGTT CTATATGTGT TTTTGG TG AT 612 0 

TTAATTACTT GTTCGTTGAC ATTTACAAGG CCTTTTTTAA GTAACTG TTT GACCTCATTA 6180 

CGTGTACCGA CGCCCATATT TGCTAAAAAT TTATCTATTC TCATCGTAAA AACCTAACTC 6 24 0 

TACGTCTTAA TTTTTCAGGA ATTTCACCTA AG AATT CGTC CGCAAGACGC GTTTTAATTG 6 300 

TGATTGTACC GTAAATTAGA ATACCTACTG TAACACCTAA AATAATAATG ATTAAGTAAC 6 360 

CAAGTTTAGT AGGTTCTAAG AATAGATTTG CAAGGAAAAA TACTAATTCT ACACCTAGCA 64 20 

TCATAATAAA TGAATACAAG AATATTTTTG CAAAATGAAT CCAACTATAG CTGAATTTAA 6 4 80 

ACTTCG CAT A TTTTTTAAGA ATATAGAAAT TACATCCAAT TGCAAATAAT AATGCGATAC 6 54 0 
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ACTTGATAAC TACAGAAGCT AAAATAACAT 
GTAACATTGA TGCCGTTACA CTTAATAGTG 
5 ATAATAAGCG ACTAC CATCA TGGTTAGGGT 

AGAAAACTGT GAATAATGGT TGTGCCAAGG 
TAAACATTAA TACACCAATA GATGTTCTAA 

10 

CTGCAAATGT TTTTGTAATA TAAGGAATTA 
TCGGAATCAT TACAATTTTA TTAGTTGACA 
ACTGTGAAGG TATACCAACT AAAGATAAAG 

15 

TAAATAATGG ATAATTCAAA CTTACAATAA 
TATACATCTT GCCATATGAC ACATCTATAT 

20 TATTATG CTT ACGCTTTCTC CAGTAATACC 

CTGCTGCTGC AAAAGTAGCA ATACCATTGG 
GTACTAAATA ACTTCCGATT AATATGAAAA 

25 ACACTGCTGT TGGCCCCATA GATTTATAAC 
CAGGAATAAA GATAACAACC ATACTAATGA 
ACCAACCGTT TTTATCATGA ATGTTTCTAG 

30 AGAAATACAG TACCAAGAAA CCTAAAACAC 

TATAAAATTT CTGACTTACT TTATATGCCC 
AAGCTGCTAA TGGTACACCT GCTGTCGCAA 

35 

CGTATGTGAA CGGCGCCATA TTTTCTTGTC 
AAAGTACGCC CAATACCTTG GTAATTAATA 
CCATTTCTTT ACTTTCACTC ATTACGAATC 

40 

AACTAAAAGC TGTTTCTCTG TAAAATCATT 
TATTTCATTG TCGTATATTC AATGAATTAT 

4S AATACTAGAT TTTGATTAGA ATATTACGAA 

GATGAACATC GCATAACAGT AGAAAAATCA 
TATGAAGTTC ACATTATAAA TATATTCAAC 

so AGCAAAGTTT AAAAAAGTAC TATAAAATAG 

AAGCGTATAT GTAT CAAACA ATTATTATCG 



AAACTGTTAA TTTCTGTTTA TCTATACCTT 6660 

AAATTAGTAT TGCTACAGGC GCATAATAGA 6 720 

CATGACCTAA AACAATTGGA TCGTAACCAT 6780 

CCATAATTCC AATACTAGCT GGAACAGTTA 6 84 0 

TTTGATGATG CATTTCATGT AAGCGACCTT 6900 

AACTCACTGC AAAACCAGCA CTTAATGATG 6 960 

TATTTAGCAT ATTAAAGAAT ATATCTTGTA 7020 

CACC GTTATG TGTAAATTGA TCTACTAAGT 7080 

CGAACGGTAT ACTATAAGCA ATAATTTCTT 714 0 

CTGTGTAATC AGATTCGACC ATACGATCAA 7200 

AGAGTGTGaA TATACCAATA ATCGCACCAA 7260 

CTAATAAAAT AGAGCCATCA AAGACATTTA 7320 

TCACGCGTGC AATTTGCTCA GTTACTTCTG 73 80 

CTTGGAATAT CCCTCTCCAT GTCGCTAATA 744 0 

TTCTTATAAT CCAAGTAATA TCATCGACTG 7500 

CTAATGTTAA TTCAGAAATA TAAGGTGCTA 7560 

CGGTAATACT CATTACAATA AAACTCGATT 7620 

CAATAGCATT ATATTTCGCA ACATATTTCG 7680 

CTGCAATTGC AATATTATAT GGTG CAT AAG 7 740 

CACCAATTAA ATAGTTGAAT GGAATGATaA 7800 

TACTAATGGT AATTAAAAAG GTTCCACGCA 7 860 

TCCCTATCTC ATGTTTATTA AAGTTTTGTA 792 0 

TTTCATTATT ATGAATATAT CACAAAACTT 7980 

CATAACAAAA TTATCAACAC ATTGTCATTG 8040 

ATTTCATATA AACATTATAC TACTATTTGA 8100 

TTCTTATCAT ACACATACAT CTTCATTTTT 8160 

ATAATTGTCA TCTCATAACA CAAGAGATAT 8220 

CAATTGAATG TCCAGTAACA AATTTGGAGG 8280 

GAGGCGGACC TAGCGGCTTA ATGGCGGCAG 8340 
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GTAAACTCAA AATATCTGGT 
AAATTATTAA GAACATTCCT 
ATAATGAATC CATCATAGAT 
ACGGGCGTAT GTTTCCAGTT 
CTATCGAACG CCAACATGTA 
ATACAGACCA AACTTTCACT 
TGATTGCTAC AGGTGGTACA 
TCGCACAAGA TTTAGGTCAT 
CAGCTGAACC TTTCATCAAA 
TGTCAGTACT TAAGAAAAAT 
CTCATTTTGG TATCAGTGGT 
AAAAAAATCA AAAGACACAG 
ATGAACAATT AAAACAACAC 
AAAACAGTTT GCATGGTCTA 
GAATCGATGA AAATACCACA 
ATATGTTTAA AGGGTTTGTA 
TCACAGGTGG TGGTGTGTCA 
TTCCGGGATT ATTTTTATGT 
ATATTACAAG TGCACTCGTA 
ATG CAT CAAT GGAATAATAG 
TCATTCAAAT AAAAATGACC 
GTCATTTCGT TAATTATGAT 
CACCTGTAAT CAGTGCAAAT 
GAAGTTCTTT TTCAACTTTG 
CTTTTGGAGC TGGCTGAATT 
TTGCTAAAAT TTCATCAACA 
CTTCATCAAT CATTCTATTG 
CTAATTGTTC TGGTGTTGCG 
CAATTCGCAG TAAGCTATTT 



GGCGGTAGAT GTAACGTAAC TAATCGATTA CCATATGCTG 84 6 0 

GGaAATGGGA AATTTTTATA TAGTCCCTTT T CAATTTTTG 8 520 

TTTTTTGAGT CTAGGGGTGT TAAATTAAAA GAAGAAGATC 8 58 0 

TCCAACAAAG CACAAGACGT GGTTGATACA TTAGTGACAA 864 0 

ACGATTAAAG AAGAAGAAGC TGTTAGTAGA ATCGAAGTTA 8700 

GTACATACTC AAAATAATAG TTATGAAAGC CATTCGCTAG 8 76 0 

AGTGTCCCTC AAACTGGTTC AACTGGTGAT GGTTATAAGT 8820 

ACCATTACTG AGTTATTCCC GACCGAAGTT CCAATTACAT 888 0 

TCCAATCGTC TAAAAGGTTT AAGTTTAAAA GATGTTGAAT 894 0 

GGTAAAAAAC GCATCAGTCA TCAAATGGAT ATGTTATTTA 9000 

CCAGCTGCAT TAAGATGTAG TCAGTTTGTT TATAAAGAAC 9060 

CACATTTCTA TGG CAATCGA TGCATTTCCT GAATTAAACC 9120 

ATCACATCAT TATTATCGGA CACACCAGAT AAAATCATTA 9180 

ATTGAAGAGC GCTACTTACT GTTCATGCTG GAACAAGCAG 924 0 

TCACATCACT TATCAAATCA ACAATTGAAC GACTTAGTAA 93 00 

TTTAAGGTGA ACGGGACATT ACCTATAGAT AAGGCATTTG 93 60 

CTTAAAGAAA TTCAACCTAA AACAATGATG T CTAAATT AG 94 20 

GGTGAAGTAT TAGATATACA TGGTTATACT GGTGGTTATA 94 80 

ACAGGACATG TCG CTGGATT ATATGCCGGA CATTACTCAC 954 0 

TATAAAATTT GGTTCGATTC TCTTTAGTAG ATCAACTTTT 96 00 

TTAATATAAC TGAGTCACTA AAAAGTGTCG TTATATTAAG 9660 

TCTTTTTCGT TTTTAGTACG TCTTCTAGCT AACAAAGCCG 9720 

TCTTTCAATG GTAAATCCAT TCCTTCAGAA CCTGTATTTG 97 80 

CGCGATTCAT GTGTCTCTTC TTTTTTAATA GGCGTACAAA 9 840 

TCTTTTGGTG ATACTTTCGT CGCTTCAGCT GGTAATTTAA 9 900 

ATGAATTGCG TGTGTTGTTT GATGTCATTT AATGTCGCAT 9 96 0 

C CATCTGCAA CATATTGATC AATTAATACT TTTACTTTAG 10 020 

ATCGCTTTGA ATTTCGCATA TGTTTGTTGA GCAATGTTAT 10 0 80 

TCTTTTTCAG TAATTACTGC TTCTATATCG CTTAATGCAA 10140 
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CATCCATTTG TAATTTTAAA GCAGTTATAG CTTTTAATGC ATCAGCCTTA TTACGATTAC 10260 

TTACTTTTCG ATAATTTTGC ACT AAAG CAG TGACGCGTGC AAGATCATCA TTAATCGTTT 10320 

£ TTTCAGCATC TGGCTTTTTA ATAGGATGTA CATCTAAATC ATGTATTGTT TGTAGATTTA 10380 

ATGATGCTGT TTTATCAACT TGTGCATTGC TACGATCTTG ATCAATTTGT CCAATAGCAG 10440 

TGTCATAAAT ATTTTGTAAC TGTG CTAATA TACTATTTCT TTCTTCTACC GTTGCTTGAA 10500 

'° TATTCG CTTC AATTGCTTGT TTTTTATCGT TGAATAATGT TGTCAATTGT TCTCGAGCAG 10560 

ACGCCTTTCT GTTAATAACA GGTT CGATTT CACGAATTTC GTTTTTCTCA TCATG CAATA 10620 

AATATGCCAC ATCTGCATTA GTCACTGCAC TAGCAATTTG TTGTTTAGCT TTAATTAACT 10680 

CTTTTTCAAC TTGTGCTATT GCAATATTTT GTTCTTCATC TGTCGCTTCG TTATTTGCTT 10740 

TAATTAAATT AATTTTATTT GTAGCGATAT TTTGAATTTG TTGTAATGCT GTTGCTTTAA 108 0 0 

2Q CTGTTGTCGC TGGTTTAATT TTTGAAATAA TATTTTGAGC ATTTATACTA TCTTGATTAA 108 6 0 

CTTGGGCAGT CTTATCTGCA TGATTGATCT GATCAATAGC CTGATTAAGT GCTTGTTCTA 10920 

CTAAATGTTT AGCAGCTAGT CTTTCTTCTT CAGTTGATAA ATCGCTTTGA TCGATTAGTG 1098 0 

25 CATTTTGAGC TTCGGCTTTT ACACCAACAG ATTGACGCGC TGCTGGTTTA ACTTGAACTT 1104 0 

TAGGTAAAAT CACTTTGATG TTGTCGTTG C CATCAGTCnC AGTnCGATCC ACTTCTGCAT 11100 

TCGTTTTGTT TTGTGCAATG TCATTT 1112 6 

30 (2) INFORMATION FOR SEQ ID NO: 172: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3660 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 172: 

40 

TTGCCCCGCA CGGCGGTGTG nTTCCTAGAA ATAATGAATA TAAAGaGAAA TATATAACAA 60 

CGATTTTGAA TTATGAACCT GGTGATATCG TTACAATCAA ACGTGTGAGA GATAAGACCG 12 0 

45 ATTTG CTAAT ATATTTGTCT AGTAAAGATA TTTCTATTGG TAATGAAGTG GAAATTGTAT 180 

CGAAAGATGA AATGAATAAA GTAATTATCA TTAAACGTAA TGATAATGTA ATTATTGTCA 240 

GTTACGAAAA TGCAATGAAC ATGTTTGCTG AAAAATAAAA TAAAGAAGCC ATAAAGATAT 300 

SO CCATGATTGA ACTGATAAAG ACATATGGAT AATTGCTTTA GGCTTCTTTT TTATTAGTTA 36 0 

ATTTATCAAG TGAGTATATT TGAGTAAAAT ATTCACTGCA TAAAGATTGA AGATAATCCA 42 0 
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CTGTGGACTC GGACGCTGGA AAGTCAATTT AGCAATCGTC CAACTAGATT GTAGAACTTC 54 0 

GCCTAATAAT ACACCTAAAA TATATTGATA ACTCATTGTG ACAAGTAGTT GAATTTCTAC 6 00 

TATATTTTCA TCTTTTAATA TAAAATACAA CATGATAGAA ATTAAAGTTA TAACAACAAT €60 

GGGTGAGCCT TTTCtAGATG TTAAAATTAA AAAATAAATA AAT AT CAATA AATAG GTAAA 7 20 

TATAAAGAAA CTAGGTATCT GATAATGGCT CGACGCTAAA CCTATCAATA ACATAATAGG 7 80 

TGGCATAAAA TAACCACCAA TCGTTGTAAG CCATTGGCCT GCTAGATGTC TAGATTGTGT 84 0 

AATTGCGAAT CCTTGTTGTA ATGTCTGTTG TCGCTCTCGT GGACTTGTTA CAATGACTAA 9 00 

ATCTTTTGCA CGGCCACCAG CGAGTTTATT AAACAGTACA TGACCAAATT CATGTGTTAA 96 0 

AACAGGGATA TAGTTTAAAA TGACATCTAA ATAGTTCAAA ACAGGCTTAT GTCTATATTG 102 0 

ATGAATAGCA ATATAACAAG CTGCAACAAT AACGATAATG TATATATTAA GTTGAATTGT 1080 

CGTATTAAAA AAGTTTGATA AATAATTCAT TGTTAACCTC ATATAAGATA TTAATTTAAA 114 0 

GTTTGCTTAT CACTTATTAT AAATGATATT GG CAT CAATA GCGTTAGACT TTAGACTTAC 12 00 

CTTAGTTAAA CTAATTTTAA TTTTTGAAAA GGTGAATATG TGTTAAAATA AAGCAAAATC 12 6 0 

ATTTCGATAT AAATAGGATG AATATAAATA CTGTTAATAT TGATTACACT AACATAATAA 13 2 0 

TGAAATAAGA TAGGAGATTC CTG TTATG AC TGTTGAAGAA AGATCCAATA CAGCCAAAGT 13 80 

TGACATTTTA GGGGTCGATT TTGATAATAC AACAATGTTG CAAATGGTTG AAAATATTAA 1440 

AACCTTTTTT GCAAATCAAT CAACGAATAA TCTTTTTATA GTAACAGCCA AC C CTGAAAT 1500 

AGTGAATTAC GCGACGACAC ATCAAGCGTA TTTAGAGTTA ATAAATCAAG CGAGCTATAT 1560 

TGTTG CTGAT GGGACAGGAG TAGTCAAAGC TTCGCATCGT TTAAAGCAAC CTCTAGCGCA 16 20 

TCGTATACCT GGTATTGAGT TGATGGATGA ATGTTTGAAA ATTGCTCATG TAAATCATCA 16 80 

AAAAGTATTT TTGCTAGGGG CAACTAATGA AGTTGTAGAA GCGGCACAAT ATGCATTGCA 174 0 

ACAAAGATAT CCAAACATAT CGTTTGCACA TCATCACGGT TATATTGATT TAGAAGATGA 18 00 

GACAGTAGTG AAcGnAnTTA AACTGTTTAA ACCTGATTAC ATATTTGTAG GTATGGGATT 1860 

CCCTAAACAA GAAGAATGGA TTATGACACA TGAAAACCAA TTTGAATCTA CAGTGATGAT 19 20 

GGGCGTAGGT GGTTCTCTTG AAGTATTTGC TGGGGCTAAA AAGAGAGCGC CTTATATCTT 1980 

TAGAAAATTA AACATTGAAT GGATATATAG AGCATTAATA GATTGGAAAC GTATTGGTAG 2 040 

ATTAAAGAGT ATTCCAATAT TTATGTATAA AATAGCCAAA GCaAAAAGAA AAATAAAAAA 2100 

GGCGAAATAA TCATGATGAC AAAAATAAAA CCGAGGAAAT CCTTAAATGG AGATTCTCGG 2160 

TTTTTTCGGT TTATTTAATA ACGAAGCGGG ACTCATCGAG TTTGTTTCTA AATTCTTTTT 2220 
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CATCAAGTTC ACCGTAATCT TTTAACTTTC CGCCTT CAAT CCAAGCAATC TTAGTACAAA 234 0 

ATTGTCTCAC TTGTCCTAAG TTATGACTAA CGAAAAAGAT GGTTTTGTTT TGCTCTTTAA 24 0 0 

5 ACTCGTAAAT TTTATCTAAA CATTTTTGTG CAAAAGTTTG GTCACCTACA GATAAAGCTT 24 6 0 

CGTCAATGAC TAAGATATCT GGATTAACTG TGATATTAAT TGAAAAACCA AGTTTTGCAC 2 520 

GCATACCACT TGAATACTTT TTAACTGGTT GATAAATAAA CTCACCAAGT TCACTAAATT 2 58 0 

10 

CAATAATCTT AGGTGTCATC GCTTTAATTT CTTTTCG CTT AAAGCCCATA CATAACATTT 2 64 0 

TAAATTCGAT ATTTTCAATC CCTGTAAGTT GTCCACTCAA GCCAGCACTA ATTGCGATAA 2700 

CGCTGACTTC ACCATTACGA TCCACTTTGC CAA CAGTAGG CGACAAAGAA CCGCCAATGA 2760 

IS 

TATTGCTCAA CGTTGATTTG CCGGAACCAT TGATGCCAAC AAGCCCTATG ACGTCACCTT 2 82 0 

CATATGCTTT TAAACTAATG TCATCTAAAG CGAAAAATGT TTTGTTTTTA TGTTTGGGAA 2 8 80 

20 TGAGCGCATC TTTCATACGT TCTTTATTTG TACGATAAAT ACGATATTCT TTTGTTACAT 2 94 0 

TTTTAATGTT TACCGAAACG TTCATTTGTA GACCTTCCTT ATTCACATTT ATCTAGATTA 3 0 00 

TAATATACTA CTCAACAGTT GTTAAATTTT AAAACCTGTT GTAAAGTGTA TAGAAGATTT 3 060 

25 TGTTATTATC AGAGTGGGTG TTTTGACACA AAATGTTAAT CATCAATGAT AACAATGATA 312 0 

TTTAAAAACT AAACTTATTT CAACTTACAT GATTGTATAC TATAATGTAT TTGTAATAAA 3180 

CTAATATTTT AAAGAACTAG ACAATAATTT TGATAGCATC CATGTATAGT GATAGTATTT 324 0 

30 ACAACAATTA TTATAATACT ATTTAGTTAA GTAGAGAAAT AGTTAAACAT TTGAAAGTGT 33 0 0 

GGTTTAATGG AATGTCAGCA ATAGGAACAG TTTTTAAAGA ACATGTAAAG AACTTTTATT 33 60 

TAATTCAAAG ACTGGCTCAG TTTCAAGTTA AAATTATCAA TCATAGTAAC TATTTAGGTG 34 2 0 

35 

TGGC TTGGG A ATTAATTAAC CCTGTTATGC AAATTATGGT TTACTGGATG GTTTTTGGAT 34 8 0 

TAGGAATAAG AAGTAATGCA CCAATTCATG GTGTACCTTT TGTTTATTGG TTATTGGTTG 3 54 0 

GTATCAGTAT GTGGTTCTTC ATCAACCAAG GTATTTTAGA AGGTACTAAA GCAATTACAC 360 0 

AAAAGTTTAA TCAAGTATCG AAAATGAAcT TCCCGTTATC GATAtACCGA CATATATTGT 3660 
(2) INFORMATION FOR SEQ ID NO: 173: 

4S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13868 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 173: 

55 
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ATTAATCACT TGTTGTGTAG AGTCTTGTCC GTTTTGGTTA TGATTGTTAG CCATGATATA 12 0 

CCTCCCTTAC AACACTCGTG GACCAGAAGT TTTCTGATCT CTCACATTAA CTT CTAACTT 180 

ACGTACTGGC ATTTCTGTGA AATATT CTAC ATT CTTTTT A ATATCCGAAC GAATTGCTTC 24 0 

AGTTAAAGAT TGAACTTGAA CATTATTTGG TACGAAAAAG TCAGTTTTAA TGTCGATATA 3 00 

AGATTTATTT TTTTTGTTAT ATAGTTTCGC AACTACATTT GGTTGTCTTA CTTGATCATA 3G0 

TTTTGCAACC GTATCGAATG CCGTCTTTTC AACAGCTTTA CGAGATACGT AAACATG AC C 420 

ATCATCGAAG TCTTTGTATA ATCCAGGTTT TCGATGCGTA GGTTTGAAGA TACTAAATAC 4 80 

TAATATAAGA CCTATTAATA TCAATAGTGC AGCAAGTGAA ATAAGTAATG GTTGGAACCA 54 0 

TTCAAATTGA AGGAAGTAGT CTTGATATTC AG TTATACGT CCATCTTGGA TATACATGAA 6 00 

TAACAGGAAC CCCACGaTTA CTACTATTAA TAAGCCAAGG ATAAAGTTTT TAAGTCGTTT 660 

CACCCCTAAC GACACCTCCT TAGTTAAAGT TAATTTAAAA A CAT ATT AAA TATGTAC CCA 72 0 

TCAGTTTTTT TCTTAAACAT AATAAATTAA TAACTTTAAA TTTATTTTTA ATATATAAGA 780 

TGAAGTACCA TTTAGTAATA TATTCCCTAG TTTTTGTAAA TAAAACCTCA TTATTAATTA 84 0 

ATTyTCGTCA ATATGTTTTG AAGAACGATA TTCTAAAATA TCTGGGTCAC GATGTTTAAT 90 0 

TAAAAC CTT A TTACTATTTC TCGGTTTCTC CTCACTCAAA GATTTTATAA GCGACCATAT 960 

CAT CG CTATA ATGACCACGG AAAATGGTAA CGCAGCAATG ATTAATAAAT TTTGAATTGC 102 0 

TTGAGTACCA CCTGTGTAAA TCATGATGAT TGCAAATAAT GCCATAATGA TACCCCAACT 1080 

CACTTTGACA AATGACTTCG GATTAATATC AC CACTTGAA CTCAACATAC CTAAAACATA 114 0 

AGTTGCCGAA TCCGCTGATG TAACAAAGAA AAT CATAAT A ACAAGTAAAG TAATTAAGCT 12 00 

TAATACAAAA CCTAGCGGAT AATGTTGTAG CGTCGCAAAA GTTGCTGTTT CTGTCG CAGC 12 6 0 

TTTAG CAATA TCGGCAATAT GATTATCTTG TAAGTAAATT GCTGACGCGC CGAATACCGC 13 2 0 

AAAGAATATA AAGCAAACTA ACGCCGGGAC AAAAAGTACA CCTAGAATAA ATTCTTTAAT 13 8 0 

CGTACGTCCT TTTGACACAC GTGCAATAAA TATACCTACA AATGGTGCCC AAGATATCCA 144 0 

CCATGCCCAG TAAAAGATTG TCCAATTTTG TAACCATTGG AATTTTTGAC CACCTGTCGG 150 0 

AATGCGTAAA CTCATACTAA AGAAATTTGC AATATAATTA CCTAGACCAT TCGTAAATGT 1560 

ATTTAAAATG TATAGCGTTG GCCCAACAAT AAAAAGACCA ATAAGTACTA CAAAAGCAAG 1620 

TAACATGTTG ATATTACTCA ACGTTTTGAT ACCTTTATCG ATACCTGACC ATGCTGACCA 16 80 

AGTAAATAAT ATGG TTGCAA TGACAATCAA GATTACTTGC ATCGTGAAGT TACTCGGTAC 174 0 

ATTAAATAAA AAATGTAAAC CTT CGTTTAT TTGCAATGCA CCGAAACCTA ATGTTGCAGC 180 0 
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CATTGCCTTT TCACCTAATA AAGGCGTCAA 
ATGAAAGCTA AAATATGCAA ACACTAGCGC 
£ CCCCCAATGG AAAAATGAAA ACTGCATTGC 

ATGAATAGGC GTTAATTTGA AGGCATGACT 
TCCTATTCCC ATACCAGCAC TAAATAACAT 

10 

ATCTTCGCCT TCTTCACCTA ATGTAATGTT 
GACAAATAAA ATAACTAAAA CGAGCAATAA 
TGTAGTAATG TTTTGCGTGA GTTTTTCTAA 

IS 

AAATATCGTA CATATCACTA AAGATACCCA 
AAATACAAAC CCTTTCTGTG TAATGGTAAG 

20 TTTGTAATTT TATATAGACA CAATTAATAA 

CACACTCAAA TTATTT AT CA TTGAGCAACA 
TCTAGTGCAT TATTGATTTG ATACCTGCAA 

25 TCG CTAGACA CAAAAAATAA GTCGCCTATA 

ACTAATCTAT ATATTAATTA CTAATTTTCC 
TGCTTGATAT AAGTTTTCAG GTGATAAACC 

30 ATGCCCTGAT TCTATATTTT TCGTAATATC 

AGGCGTTCGA TGAATTGGAC GCGCAAACAT 
TTTTAATGCA TTTAAATCTT GATCTTCATT 

35 

TGGTTTTATC AGTTCAATCA TAGTATTGTA 
ATAAT CTACT AATGGAATTT CTTTAAATTG 
GATATCTGCG CCCATCTTTT CACACCACTC 

40 

GACAGTTAAA CCATACCGTT TAGCAATTTG 
ATTAATGATT AAGACAGACT TCCCTTCGTT 

45 ATCAAAAAAC GTTTCATATG CCGTAATACC 

ACTTATGTTG TGTGGTGCTT TTGCAACTAT 
TGATCCTTGT CTATTTGGCG ATCCAGCATA 

SO AACGTCTGGT CCGATAGCTT CAACAGTACC 

TTGAGTGACT T CCATTTGTC GTTGCTTTGT 



TGTAGCGCTG ACTAAGCCAG GATATCCTTT 192 0 

GACAATACCA TAGACTGCCC ATGCATGAAT 198 0 

ATCATTAATT GCAGATTGCG TGCCAGCTTT 2 04 0 

GATTGGTTCT GCCGTTGTCC AGAACACAAG 2100 

AGCAAACCAA GACGGCAATG AGAATTCAGG 216 0 

TGCGTATCTC GAAAATAAAA TATACACACA 2220 

ATAATACCAA GAAAAATGTA GCGCAATAAA 22 8 0 

CTGTTTCGGA AATATTGCTC CAAAAGCAAC 234 0 

AAACACTAGA CTTACTGATT TATTTTTCAT 2400 

TTCATACCCA TAACTGCAAC ATTTTAATCA 2460 

TGCCTCATCT TTTAAAAATG ATATATAAAA 252 0 

AAGTATTTTA TTG TATTTAA GTAATGCCTT 2580 

AGTTGCCATA TTTCCGTTTA GAATCAATAG 2640 

CAGTATTTTC TGCATAAGGC GACTTTACTT 2 700 

AATCATTGAT TGTTTTTCCA ACAATTGATG 2 76 0 

TTCAAAAACT TGTGTCGTTG TTGGTTGGTA 2 820 

TTCTAAATAC TCATGTTGTT TAATCATATC 2880 

AAATTCATGT GTAAATGTTA TACTTTTTAA 2 94 0 

AAAAG CTACG ATAGTCGTAA TATGCCCTAA 3 000 

ATACAAGTCT GTATTATAGG TGCAAAATAT 3 060 

ACG CACTAAA TCCTCTTTAT GATTCAATAC 3120 

TGTTGTTTCT TGTCGTGATG CTGTTGTAAT 3180 

AGTGGCTATA CTGCCTACAC CACCGGCACC 324 0 

TTCAGCAGGA TTCGTAGAAA TTTTAAATGT 3 3 00 

AGTTAGCGGT AGACTAACCG CTTCATTAGC 33 60 

AGCTTCTGAC ACCAATTGAT ATGTCGCATT 3420 

AAATACAACG TCACCCGGAC TAAATAATGT 34 80 

AATAGCATCA AACCCAAGTA CACGAGGTGC 3540 

ATCTAGAGGA TTTACACTAA TGCTATTTAC 3 600 



843 



EP 0 786 519 A2 



ATTTCCTTCT TCCAATTTAA AGGGCTTCTC AAATCCTATC ATTTTCATAT CGTTTCACCT 3 720 

CATTTATGAA CTTATTTCTT ATTATACAAA ATAGAAGCCA TGTGTGCTTA TATCGCAGCA 3780 

5 TCATGACTCC TTTTTCATTT GAATATATAA ATAATTACAG ACGACTTTCG TATTAAATTT 3 840 

TAGACTTATT TCTACCATGT TGCTGAACAA ATTTACTTTA GATAAAAAAT TATTAAATTT 3 9 00 

TGGTCAATTA ACAAAGTTAG TTTGTTAAAA CGTgATACTT TATTATTCCG TTACTTTAAT 3 960 

AACTTGTTTA CCAAAGTTAT CGCCAGTaAA TAAATTTTTA AATGCATGTG GCGCATTTTC 4 02 0 

AAAACCATCT TCAATGGTTA CTTGTGACTG AATTTTACCT TCTTGAACCC ATGTTGCAAG 40 8 0 

CTGTTCACTA GCTTCTTTAA AAGCATTAGC GAATTCACTT ACCAAGAAGC CT CT CAT CAT 414 0 

IS 

TACTTGCTTC TTAATAAGCG TACCTTGAAT ACGTGGTCCG ATATCGGCTT CAGGATGATT 4200 

ATATGACGAA ATTGCGCCAC ATACTGGTAC ACGTGCAAAA CGATTTAAAT GCTTAAATAC 426 0 

20 TTCATCGCCA ACTGTTCCAC CAACATTTTC AAAATAAACA TCAATACCAT CTGGTACTGC 4 32 0 

TTGTGCTAAC GCTTCTGCAA AATCCTCTTT CTTATAATCA ATACCAGCGT CAAAGCCCAG 4 38 0 

TGTCTCTGTT AAATAATTTA CTTTTTTGTC GCCACCCGCA ATACCTACTA CACGGCAACC 444 0 

25 TTTAATCTTA G CAATTTG AC CTACAACTGA ACCTACAGCA CCAGATGCAG CTGAAACCAC 4 50 0 

AACAGTATCA CCGGCTTTAG GTTGTCCAAT ATCAAGCAGA CCATGATATG CTGTTTGTCC 4 560 

TGGCATTCCT AAAACACTTA AATATAAATC AAGTGGTACA TCTGTCGTTG GAACTTTAGT 4 62 0 

30 AATTTGATCC GCTTGGACAT GATTAATGAT TCGCCAAGGC AACATACCTA CAACGACATC 46 8 0 

TCCTTTTTTA TAATCTGCGA GTGTCGAATC AATTACTTTT GCAACGACAT GGCTAACAAT 4 74 0 

CGGTTTACCA ATTTCAAAAG GCTGTACATA CGAATCTGCC TTAGTCATAC GTCCTCTCAT 4 80 0 

35 

ATATGGATCC ACTGAAATAT ACAGCGTTTG TACAAGTACA CCATCGCTCT CAAGTTTaGG 48 6 0 

CGTGTCAATC TCTTCaATTT TGAATGTATC CTCTTGAGGC ATGCCkTCTG GTATTTTGTT 4 92 0 

AAAAAGAATT TGTTTATTTT GCATCATTAA TCACCTTTCT TTATTTGAAA CTTTTACTTA 4 98 0 

40 

TTTGTTACTT AAGCGTTAAG TTTGAATTGT GTCtTCGTGA TGTCTGTATG CAAATACATT 5040 

CTTAGTTGTT ATATTTTGAC TTAAGCACTG ATTCATTCAT GTAACTT CAA CCACATTATA 5100 

45 TTTGCTATAA TCATAAATTT AAAATGTTAC GACTTAGACA TTTTATGGAA ACTCTCAAAC 5160 

AATAGATAAT TTTTGAAAAG CTCTAATATT ACAAGCTTTT TTGCCCCAGA AAAACTAGCA 5220 

GTTGCTTTAT TTTTTC CATA AGAAGTCGAT TAACTCATTA GCAACATTTT CATTCTCATG 52 8 0 

50 AAGCTGACTA TGTTGTGCAG GCTCACCTTC ATATTTAGAT TCTCGATAAC TTTT CGGACT 534 0 

ATTTCCCAGT AAATATTTTA ATGATTT CGA AGAACTATTA GACACT CTGC CGTCTGAATG 54 00 
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ATCTTTTAGC ACG CGTAATT GCTGATAAGG TTGATTCATT CGACTTGGTT TACCATCTTT 5520 

ATCAACTGTA ATTTCATTGA CATCTTCATT CATATTTAAA ACACCATTAA ATGTCCCTGC 55 8 0 

AATATTCACT TGTTTGTTTA ACTGTGGCAG TGACTTGTCG TTACCATATG TCATCATATA 564 0 

TTGTGCAAAT GTTAAGTTCC CCATTGAGTG ACCGACAAAG TTGAATTTAT CGAAATTGTA 5700 

TTCAGATTGT AACTTAGTCA GTACATTTTT AAACCACGCA GCATTCTTAT CCAAATAGCC 5760 

TTGTCTGTTA TTTTCAAGTT CAATTTTCAC AATAGGATTC ACTGCATCTT TTCTTAGTTT 582 0 

CCCTTTAAAT GTCACTGCAC CATCCTTTGA AACGTAAGCA GTGATGATAT CTTTAGTTAC 58 BO 

CCCTCTTTTT TCTGCTTGCT TCACCATAAA CTTTTCAGAA TTGGCACTAC CACCAAATCC 594 0 

ATGTAAGAAC AATGTTGGAA TTGGCTTTTT AACAAATTGC TGTTGTTGTA TTTTAAATGT 6000 

TTGTG CCTGT CGTTGACTAA ACACCACCAT AATAATAGAG CCTATAATAA TAGCGACCGC 6060 

TAACAATGTC GTAATAATTA CAAAAATTTT CTTCACACTT TTAACTCCCA TTCATGTCTT 6120 

TTATATAAGT ATAAAGGATG TGATTAAAAA TGTCCTTTAG TTGATTTTGA ATACAT CATT 6180 

AACTTTTAAG ATGACTTTGG AAAGTTGTCC GTTAACGTTT GTTAATTGAT TGCTTCTTTA 624 0 

GCTTTCAATG GTGTGTCACC CATTGATTAA TATATAAATA TGTATATGCA TGTTTAATTT 6 3 00 

ATCTCTTTCT ATAAATAAAG ACCTACCAGC ACTCGACTGA TAGGCCTTTT AATATCTATA 63 60 

ATTATTTAAT TTC TTT T GT T TCGGCTAACT CTTTGTACCA ATAAGCACTT TTCTTAGGAT 6420 

AACGTTCTTG AGTCTCAAAA TCGACATAGA ATAAACCATA TCGTTTTTCA TAACCATTTG 64 80 

ACCAAGAGAA CACATCCATT AATGACCAAA TAAAGTAACC TTTAACATTT GCACCATCTA 654 0 

TAATAGCATC TGCAATAACG TTCAAATGTT GTCTTACATA ATCAATACGT GCATCATCAT 6 600 

GAACTGTTTT TTCAGATTCA ATAAATTCAT CTTTATATCC TAAACCATTT TCAGTGATAT 6 66 0 

AAAXCTTATG aTAGTTAGGA TAATCTTTAA CAACACGCAT GaTTTGATCA TATAAACCTT 6 720 

GAGGATAGAT CATCCAGTCC CAGTCTGTGC GAGGTACGTC GACATCAAAT TCACGTTGTC 6780 

CGACACCTTT AAGTTGGTAT TTAGAACCGC CTTTATCACC TGTCGCATTA TGCGTGATTT 6 840 

CAGATTCTCC ATCGTAACCT CTCATCCAAT CACTCATGTA GTAATTGATA CCTAAGAAGT 6 900 

CGTTTAAATC TTTGGCTGCA TCTAAAATGG CATAATCTTC ATCTGTAATG TTTAATTTAC 6 960 

CGCCATTAAC AGATAAGATA TGTTGCACAC CTTCCATCGT TTCACGAGAA TACTTACCTA 7020 

AATATGTTGC ATCTAAGATG AATTTATTAT GGATGATATC TTCTAATTCT GCTGCACGAA 7080 

CAT CTTCAGG ATTTGATGGA TCGAACGGAT ATTTTGTTGG CAATGCGTGT ACAACACCAA 714 0 

TTTCTCCTTT GTATCCG CCA TCTTTAAATA ATTTTACTGC TCTAGCATGA GCCACCATCA 7200 
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CTACTAAATA TTGACCATCA CCAATAGGTC CAATTTCATT GAATGTAGTC CAATATTTTA 732 0 

CTTCTGGGAA TTCTTTAAAA CAATATTCAG CATAATCTAC AAAGTAGTCA ATCGTTTTAC 73 8 0 

GATTTAGAAA ATCGC CATCT TTGTGTAaCA CTTCTGG TGT ATCAAAATGA TGCAATGTTA 744 0 

CAAATGGTTC AACATGACGT TTATGACACT CTG CAAATAA CTTATGGTAA TACTCAACAC 750 0 

CTTTAGGGTT AACTTCGCCA TATCCATTTG GGAAGATACG AGACCATGCA ATTGAAATTC 7 56 0 

GGATACCATT AACACCGAAT TTTTCACTTA ATTCTAAATC CACTGGATAT CTGTTATAAA 762 0 

AATCACTCGC TGGTTCTGCA GTGTACCAAT AGTTTTCTTC TAAATACGTA TCCCATGCTA 76 8 0 

CGCGACCTTT ACCATCCGTA TTTGTC GCAC CTTCTGCTTG ATATGCTGCT GTTGCTCCAC 774 0 

CAAAAATAAA ATCTTCAGGT AATGTTTTAG TCATATGAAA AACTCCTATT CTTAATTTTC 780 0 

AAATTGTTGT TGAACGAAAT CAAGGG CTGC TTGGCCATCT CGTGTCAATT TGATATATTC 7 860 

AGCACCTTGA GTCTTCGCTA ATTTAATACC TAATCTAT CT GTATCTTGCT TAATATCTTC 7 920 

ATAGTTAGAC GCAACTTGTG GCGCTAAAAT GATTAATTGG TACTCTTTCA TAATGTCCAT 7980 

ATGTGCGCCA TATCCGCCAG cTGCCGCTTT CACTGGCACA TGATATT CTT CAGCTGCTTT 8040 

ATTAAGT GCA TTGGCTAATA ATCCACTTGT ACCACCACCG GCACAAAGTA CTAAGACATT 8100 

TGTTTGTTCT GTGATATTTG AAG CTTTAGC TGCATCGTCT GATACACCAC TTGCCGCTAA 8160 

AATTGAATCA GCTTTTTTCG TATCAAAGTT TGCTGCAACT TTTTCTTTTA AATCTGAATT 8220 

ACTTTCTTTA CGTCCTTCTT CTTCATCAAG AATTTCACTA TCATAAACTT TTAGGAATGG 8280 

GTAGTAAATA ATAATATCTA CAACAATCAA AGTAATAGCT AGTACGAATG ACCATAAACC 8340 

AAAAC CTGTA CCCATGATAA TGCCCAATGG ACCTGGTGTT GTCCAAGGTA AATTCACACT 84 00 

AAAACTATTC ATTCCTAACA CTTCAACGAA AAGTTTGAAA ATCCATACGT TAACAATTGG 846 0 

TGCTAATACA AATGGAATAA AGAACACAGG ATTCAATACT AGTGGTGCAC CAAATAAAAT 8 520 

TGGTTCGTTT ACACCAAAGA ATGTTGGTAC AACTGATGCA CGTCCAATCG CTTTGTTTCG 8 580 

TTTAGATTTC GTCATCCACA TAAACATGAA CGGGACGACC AATGTTGCAC CCGTACCTCC 8640 

AAATGTAACG ATAAACATTT GTGTACCTGA TGTAATAATT TTATCTG CGT GTTCTCCAGC 8 700 

TTGAAGCAAC TTGAAGTTCG CTTCGATATT CGCATATGTA ATGGCTG CAA TTGCTGGCTC 8 760 

TACAATTGAC GGACCATGAA TACCTACAAA CCAGAATAAT GCAAAGGCAC CAAAGATAAT 8 820 

TGTGACACCA ATCCATCCAT CTGCTGCTGT AAATAATGGT TCGAATAATT TTAAAAT AC C 8 88 0 

TTCCGCTACA TTTGATTTAA AGCTGTTGCG AATGACTAAA TCTAATGCAT AAAGAATGAT 8 94 0 

GATTACCGCT GAAAATGGAA TTAAGTCCTT AAATACTTGT GAAATATTCG GCGGTACTTC 9 000 
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AAATGCTGAT AAGAATGCTG TTAATAAACC TTTAGTTCCC ATAAATGCAC TTAAGAATCC 912 0 

ACCATCTTTG GCTGGATCAG AAGCTAAGAA CAAGAATCCA CACATCGCTG CTAGCATTGT 9180 

5 AGAAATAAAG TTAATTTGAT TTGTACTTTC TAGCTTACGG TTAAATGAAT CTGTTAAAGA 9240 

TTTCGCTGTC GTTCCTGCTA CTAAAAATGC TACAAGCCCC ATCGTATAGT TATATGGTTT 93 0 0 

CATTAAAATG GCTTCCATGC CTTTATCCCA TTTAAAACCA AATATATTTG GCACATATGC 936 0 

W AATTAATAGA AAGATACTTG AGAATAAGAT GACAGGCATT GCAGAAATAA ATC CATCACG 94 20 

GATGGCTCTT AAATATATGT TACGTGATAA TTTCTCGAAA AATGGCTTCC CTTTTTCAAT 94 80 

TTGTGCGATC AATTTTTGCA TCATTGTCAT CACCCTCTTT TAT AAAATT C TAATAAATGC 954 0 

is 

TTCATTAAAT CTTTCAGTAA AATTGTTGTC ATTAAATGAT CTTGACCATG CATCATCGTT 96 00 

ACACTGTATG CAATATCATC ACCTTGCGCT TCTTTAGCCA ACAGGCTTGT TTGTGCTCTA 96 60 

2Q TGCGCTTCCG CAATGCAATT GTTTCCTTCT TCAATCAGTG CATCTGCTTT TGCAAAATCT 972 0 

CCAGCTTGAG CTGCTGTTAA TGCTTCTAAA AACTTAGAAC GTGCATCCCC TGCAAATGCA 9780 

ACAATTTCAA AAC CTAATAA TTGGACTTCT TCTCTATTCA TAG CATT AAT CCCCTTTTAA 9840 

25 ACTTATTTTC TTTGTTTCCA AGATGTCGCA GTATCTTTTA ATACTTTATT TAAGTCATCA 990 0 

ATATTTTTGA AACCAGTTGT ACGTAACCAT TCACGAGCAG CATCTTCACC TTGTTCAATG 996 0 

TATACTTGAA CAGCACCAGA CCATGTAGCA CGGCCACAAA GTACCCCGTT GAATTTAGCA 10020 

30 CCAGCTTCGT GAGCAAATTT TAAAGTTTCT TGGAATAATT CCGCAGAAAC ACCAGCACTT 10080 

AAGTAAATGT ATGGTAAATG AGTTGCTGCA TCTTGATCTT TAAAGTGTTG TGCCGCTTCC 1014 0 

TCTTTTGTAT AAACCACTTC AC CTTCAGCA AAGCCTTCTA CATATTTCAT GTTTACTGGT 10200 

35 ACTTCAACTT TCAATACATC AACGTTAAAG CGTGGTTCTG AGAATAATTT CATTGCTTCG 10260 

TTAAnCTTTC TAGGCTTAAC TTTTGCGAAT TcAACAcTAC CGTTATcAGG AATGTTGTCA 10320 

TCGTATGTTA ATACTTCTAA AAAGAATGGA ATATCTTCTG CAACACATTC TGAACCGATT 103 8 0 

40 

CTTTCAATGT ATGCTTTCTT TTGAATGTTA ATTTCTTCAG CATCATCAAC ATCATAGTAA 1044 0 

AGTAAGAATT TAACAGCATT TGCGCCTTGT TCTTTTAAAC GTTTTGCAGA CCACTCTACT 10500 

45 AAACAGTCAG GTAAACGACC TTTAGCGTTT ACGTCATATC CAGTTTTTTC ATAAGCAAGT 10 56 0 

AATAATCCAC AATCTTTGTT ACGTGCATCT GAAGCTGGTA AAC C AT ATT C AGGATCTAAT 10620 

AAAATTGAAG ATGCATATTG TGTTAATTCT TCCGCAACTA ATACTTTTAA TTGTTCAATT 1068 0 

SO TG AG CTACAG TTGGTTCTTC AGTTTGATGT TTTGCCATCA TGCGTTTTAA AGCACCACGT 10740 

TGGTCAAATG CTAATGCAGA AATGATACCT TCGTTGTTAC TTAATTGTTC AATTGATGCG 10 80 0 
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TCATCATAAT TATTTAAATT GACATAACCT GTTTGTGCTT CTTGTGCATT CAGCATGCCT 10 920 

AAAGTATTGG CTTTTTTTAG TAAATCGTGG TCGTTTTCAT GATTAAGAAT TGCTGAAGTA 10 9 80 

5 ATTCCAGCAA CTGTAGAATC ACCTGAACCA ACCGGATTTA ATACACTTAT TGTCGGAATA 1104 0 

TTCACTCTAT AGAATGTATG ATTGTGCTTA GCGAATGCAC CTTGTGCACC TAAAGACACA 11100 

ATAATCCACT CAATCCCTTC GAATAAGGGT TGTGACACTG CCTGTTTCAA ACTTTCTAAA 1116 0 

w 

CTTTCATCAA GTGGCTGGTT AAGCAATTGA TATAGTTCAG AAATGTTTGG TTTAATGACT 1122 0 

GTAGGTTTGT ATGGATTTTC CAAAACTGTT TGCAAAGTtG CACCCGAGCA ATCTAATATC 112 8 0 

ACAGGCACAC CTTTGTTTTG GCATCGTTCA ATGATTTGTG CATAATAATC TTGATTTAAT 1134 0 

75 

CCTTTAGGTA AGCTACCTGA AATAGCAACT GCTTCAACTT TTTCTAATAA TTGTTCAAAA 11400 

TGTTTAATAA ATCCTGCAGC CTCTTGATTA TCAATCTCCG GTCCCTGCTC TAAAATTTCT 1146 0 

2Q GTTTGTTGCC CTTCATGTAA AATTGCAATG CAGTTTCGTG TTTCACCCTT AATGTTATAA 1152 0 

AATGCATGCT TGATGTCGGC ATGAT CTAAT TTTTTAGCAA TAAATTGACC TAATTCACCG 1158 0 

CCAATAAAAC CACTCGCAAG GACTGGCTCA CCTACTTGCG CAAGTACTCT TGTTACATTT 11640 

25 AAACCTTTAC CACCAGCTGT TTTACTTACT TCTTGAACAC GATTAACATC ATCTAATTTC 11700 

AATGCTGTTA ATGGGTATGA AATATCAACG GATGGATTTA ATGTTAAAGT TAAAATCATA 11760 

TGTGTCGTCC CTTAATCGTG GTATTCGCCT CTGTCCCATT TTTCTAAGAA TTCATCAAAG 11820 

30 AAATGTGGAT CAGCTTGATC TGCATTGCTT GTTTCTAAAT GTTTAATTTT AGCGATTAAT 118 8 0 

TTTTTGTTCT CTTCAGTTGG TTTATATTCA GCATTAATAA ATGCATCGAT AATATCGCAC 11940 

ATTAATAACT CAC CTATAAT ACGTCCACCG AAGCCAATAA CGTTCGCATT TAATTCTTCT 120 0 0 

35 

TTAGCGTATA A CGCTGATGT CATATCACGT ACTAGTGCTG AACGAACGCC AGGTACTTTA 12060 

TTTXCAGCAT TGTTAATACC AACACCTGTT CCACAAATAC AAACACCTAA GTCTGCATTA 12120 

CCGCTAACAA CTTGTTCGCC AACTTTTTTA CCAAAAATTG GATAATGTGT TCTTGTGAAA 12180 

40 

TCGTATGTTC CTACGTCAAT GACTTCATGT CCTTTTGATT TTAAAAATTC AGATACACGC 1224 0 

ATTTTTGTAT CTGTAACAAT ATGGTCGCAT CCTAATGCAA TCTTCATAGT AATTTTTCCT 12300 

45 CCTTAGCACA TTTTATTAAG CATATCTACG CGGATTTGGT GTCTACCACC ATCGTATTTA 12 36 0 

CCTTCAACAA AACCTTTAAC GACATTTTTC GCTAATGTGT CTCCAACAAT TTCAGATCCC 12420 

ATAGTGATCA TTCTTGAATT GTTATGGCCT CTAGTCATAT ATCCAGAGCG TTCATCTGAT 124 8 0 

50 ACTTCAGCAG CAATCATGCC TTTGATTTTT GTAGCAACCA TAAAGCTACC TGCACCAAAT 12540 

GCATCGATAA CAATACCTAA GTTACCTTCT TGACTTTGAA CATCTTTTGC TACAGCCAAA 126 0 0 
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TCTAATAAGT ATGATTTGAT GACTTCTTTT AATCGTTTGC CAGCTTCATC TGAACCAATA 1272 0 

ATAATCGCCA TAATAAGACT CCTTTTTACT TTAATTTTGA AATACCTTTC TTAAAATGTG 12 7 80 

ACATATTTAT TTGTAGGTTA TGAAAATCTT GAGAAAAGGC TTTCAATTTG ATTACGTTTA 12 84 0 

AATTAT AAA C ATAAACAAAC AATAAATCAA CATAATATGT TTATAATATG TTTGTTTATG 12 9 00 

ACGTATTTTC AAACAATAAG TGAACATTCA TATTGTGGTG TTGTTTTAAT TAGGTATTCG 12960 

TCTGAAATTG TAGTAAAACT TTGTCGAGGT TCCCGTTGaC ATAAATTTGC ATAAAAAAtA 13 02 0 

GCCCATAAAT GAATGCAAAT TCACATTCAC TTATGAGCAT ATAGATACAT ATTTTAACAA 130 8 0 

TGCAGTTATA CTTTTAATTT AGTCGACTAC TTCAATATAT GTTTTAATCG TTTCTACTTT 1314 0 

TTCTTCATCT TCATAGTCCA TGACCACTGC AGTCAATTCG TTTAACTGAC AAAATGATGT 13200 

AAAATCTTCT TTGCCAACTT TCGTATGATC GATTAACAAG TATTTTTCAA TTGAATTACT 13 26 0 

TAGTGCCAGT TGTTGCGTAT AGGCTTCATC TAATGTAGAT GTCATCACAG CACCTTTATT 13 32 0 

TACTGCGTTA CTACTAAAGA ACATCTTGCT AAATCTTAGT TTTTCCAACA TGGCGTTCGC 133 80 

CATTTCACCT ACAAATGCTT CTGTAATATG GCGCATTTCA CCACCAATTA AATAGACACG 1344 0 

AAAATGTGCT GTTTGTTTTT CTAACAAAAT TTTATACACC GGCAAACAAT TCGTAATAAT 13500 

TGTGAGCGTA TGATGATTGA CTTCTTCTGC TAATAGTTCC ACTGTTGTTC CTGGTCCGAA 13 560 

AAACAAAGTA TCCCCATCTT CAATTAATGA TGCAGCTTTT TTAGCTATAA ATCGTTTTTC 13620 

TGCAATTTGA CGGGTATGTT TTTCTTTATG CGATATTTCT TTATACTGAA ATGTTGAATT 13 680 

ACTGCGTGCA CCACCATGAA TCTTCGTTAA AATCCCTTTA TTTTCCAATT CAATTAAATC 13740 

TCTTCGAACT GTCATATCAG ACACATTTAA ACCTTCGACG ATTTCATTCG TTCTTATCGT 13 80 0 

GCCCTTTTTA TTCACTAGTT TAGCAATTTC GTCCAAACGT TCATGTTTAT TCAATGTAAA 13 860 

ATTGdtTC 13868 
(2) iNFORMATION FOR SEQ ID NO: 174: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 4 54 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 174: 
TTAAGT CAAC TTTGTCTATA CGGTTTGGAT CtTCTaCCCA ATGTCTTATA AAAGACAATC 
CCGCACCTGA AACATAACTC ATGAAATAAG AAAATGGTAT ACCATTAATT TGATCATTTT 
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AATCTTTACC CATACGAAAC ATCAATTGAT AAAATGCGAT GTCTTTTTCT ATCATTTCTA 24 0 

TTAAAACGGT CATAATTTGA TGTATGTTAT CCGTGGATAA CTTAACTGCT CCATTTAACT 300 

5 TCTCATCATG AATGAAGTCT CTTATTTCCT CCAACTGCTG GTCCTCTAAT TTTTCAAGCA 360 

AATCATACTT ATCATAATAA TGCGTATAAA ATGTACTACG GTTAACATCA GCTAAATCTG 420 

CAATTTGTTG CACAGTAATC TCTTCTAATT GGTGTTGATG TAAAAGTTCA ATAAATGCAT 4 80 

TTCTCATTGC AACTTGTGAT TTTCTAATAC GTCGATCTAT AGTCATTTAT ATCAAGTCCT 54 0 

CCCCAATGAT TATAAACGTT ATGTTCATTA TCCCACAAAT CTCCAACATT GATGATTGGC 60 0 

JS ACACAATGTT TACCTGTTTA ATATAGGTGA TACAAACAAA CAGAAAAAGG TGATAACAAT 66 0 

GAACCAACAT TTACTAGGAA ATCCAAAATT AACTGTAACT CATGTCAATG AAGTTAAAGC 720 

CGGTATTAAC CACATCGTTG TCGACAGTGT TCAATATGGA AATCAAGAAA TGATTATGGA 7 80 

20 AAAAGATGTC ACTGTGGAAA TGCGCGATGG CGAAAAATTA TATATTAATA TTTTCAGACC 840 

AAATAAAGAT GGCAAATTCC CTGTAGTTAT GTCTGCAGAT AC TTACGGTA AAGATAATAA 900 

GCCTAAAATC ACAAATATGG GTGCCCTTTG GCCAACATTA GGTACCATTC CG ACAT C TAG 96 0 

25 TTTTACACCT GAAGAATCAC CAGACCCAGG ATTTTGGGTG C CAAATG ATT ATGTTGTAGT 102 0 

TAAAGTTGCA TTACGCGGTA GTGACAAATC CAAAGGCGTC TTATCTCCAT GGTCAAAAAG 10 80 

AGAAGCGGAA GATTATTACG ArTGATTGAA TGGGCAGCAA ATCAGTCATG GAGTAATGGA 114 0 

30 AATATCGGGA CAAATGGTGT TTCTTATCTT GCGGTGACTC AATGGTGGGT CGCATCATTA 12 0 0 

AATCCACCAC ATTTAAAAgC AAtGATTCCT TGGGAAGGCT TAAATGATAT GTATAg AGAA 12 6 0 

GTAGCCTTTC ACGGAGGTAT mCCAGATACT GGCTTTTATC GTTTCTGGAC TCAAGGTATT 13 20 

35 

TTTGCGAGAT GGACAGATAA TCCAAATATC GAAGATTTGA TTCAAGCACA ACAAGAACAT 1380 

CCTCTGTTCG ATGATTTTTG GAAACAGCGT CAAGTGCCAT TATCACAAAT TAAAACACCT 144 0 

4Q CTACTAACAT GTGCTAGTTG GTCTACACAA GGTTTGCACA ACCGTGGCTC TTTTGAAGGA 1500 

TTTAAACAAG CTG CAT CTGA AG AAAAATG G CTATATGTGC ATGGACGTAA AG AG TGG GAA 1560 

AGTTACTACG CTAGAGAAAA TCTCGAACGC CAAAAATCAT TCTTTGATTT TTACCTTAAA 1620 

45 GAAGAAAATA ACGATTGGAA AGATACGCCT CATGTCATTT ATGAAGTTAG AGATCAATTT 1680 

TATAAAGGCG AATTCAAATC AGCGTCACGT GTCCCTTTAC CTAACGCAGA ATATACACCA 174 0 

TTGTATTTGA ATGCTGAAAA TCACACATTG AATCATG CAA AGATTAGTAG CGCGCATGTC 1800 

50 GCACAATATG ACTCTGAAGA TAAACAACAA GATGTAAGTT TTAAATATAC GTTTGACAAA 1860 

GATACTGAGT TAGTTGGAAA CATGAACTTA AAACTATGGG TAAGCACTAA AGACTCAGAT 1920 

SS 
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CCTGATTTTA ATCATATTGA AAATGGTCAA GTAGCTACTG GTTGGTTACG CGTATCACAT 2 04 0 

CGTGAATTAG ATCAAGAAAA ATCCTCAATC GCGCAACCTT GGCATAAACA TGAAACAGAA 2100 

s TTAAAGTTGT CACAAGATGA GATTGTACCT GTTGAAATCG AATTGTTACC TTCAGGCACG 2160 

CTATTTAAAC AAGGCGAAAC ATTGGAAGTT GTTGTAAAGG GTAGTGAAAT TGTAATTGGT 222 0 

AATAGTACTC CTGGCATGAA AACACGTTAT GAACATGAAG AAAC CGTAAA TAAAGGCATG 2280 

'° CACATGATTT ATACTGG TGG TAAATATGAT TCACAATTAA TCATT C CTAT CGTTAATTGA 234 0 

TATGCAG CAA TTACGGTCGC TTTTGATTAA AAGTGACATA GTGATAGGAC TGTATAACAA 24 00 

GAGAAAGCCA CACGCTTGGA ATCTTAAACC AAGGTGTGGC CCTTTTTATT ATTGATGGCT 24 6 0 

IS 

ATTTAATTTT ATAACACTAT CGTATTTTCT TTTTCATGAA TCATTTCAAT AATGACATTA 2 52 0 

TCTTCATTCA TTACTGCTAC TTTAGGTGCA TGGTTTTTAA TTTCTTCTTC ATTCAACTGT 2580 

GCATAAGTCA TGATTATGAC TACATCGCCT ACTTCAACAA GTCTTGACGC TGCACCGTTT 2 64 0 

20 

AAACAAATTT TACCACTACC TCTTTCACCA GCTATTACGT ATGTTTCAAA ACGTGCACCA 2700 

TTATTATTAT TCACGATGGC TACTTTTTCA TTTGGCAAGA TGTCTACCGC TTCCAATATA 2 76 0 

25 TCTGAATCAA TCGTAATGCT ACCTACATAA TTTAAATTTG ACTCAGTCAC TCTTG CTCTA 2 820 

TGAATTTTAG CATTCATCAT TGTTCTTATC ACTTTATTCA GCTCCAATTA TTATATTATC 2 880 

TATTAAACGC GCTTTTGAAA ATTTAACAGC TAAcGAGATA AATATGCGTC CAGTTATTTC 2 94 0 

30 GTGTTGTTCT ACTAATTGAG GATAACTATA AACAGCAACT TCTTCAATGC GTT CACTTAT 3 000 

ATGTGATTCA AGATATTCAG TAACCCTGTC TATAATTACT TTACTTTGAC GTTCACCGTC 3 06 0 

TTGATACAAC GCTTGTGCTA ATAGCAAACT TTTACTTAAA TGTACCGCTT CTTGTCGTTC 3120 

35 TTGCTCCGTT AAATAAACAT TTCTTGAACT TTTCGCCAAA CCATCT GCTT CTCGAACGAT 3180 

ATCAATACCA ATAATTTCAA CGGCATGATT GAAGTCTTTT ACCmTTTGCT CGaCAATAGC 324 0 

CAATTGCTGG GCATCTTTTT TACCAAAATA AGCATAATCC GGCATAACAA TATTAAATAG 3 3 00 

CTTATTAAC T ACTGTTACCA CCCCATCAAA ATGCCCTGGr CCGtTCGCTC CTTCTAACAC 33 60 

ATCAGCTAAT GGGCCTACTT TGACATCAAT ACCTAATTCA CCTGGATACA TATCTTCTAC 3 42 0 

TGCAGGATGA AAAACAATGT CCGCTCCTAC TTCTGATACT AATTCTAAAT CTTTATCAAT 34 80 

45 

TTGTCTCGGA TAAGCATCGA AATCTTCGTT TGGACCAAAT TGTAATGGAT TAACAAATAC 3 54 0 

ACTCACAATT GTAATATCAT TTGTACTAAC TGATTCGCGT ACCATCGTTA AATGTCCATC 3 6 00 

50 ATGTAAGGCA CCCATTGTTG GGATAAAACC AATCGTTGTG CCTGAGCGTT TGGCTG CTTT 3 6 60 

AACAATGTGT TGCATCTCTT TTACCGTAGT AATCAGCTTA GTCATTGTTA TTAACCTCAT 3 720 
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GATCGTATTG TTTTAAACCA TCCACACCAA CACTAAAATC AGCAAATTGC TTCACAAATT 3 840 

TCGCTTTATG TTCAACACCA TAATTTAACA TATCGTGATA AACCAATACT TGACCATCTG 3 900 

5 TACCTTTTCC TGCACCAATA CCAATGACTG GAATTGTTAA GTGCTTGCTA ATTTCTTCTG 3 960 

CTAAATCATT TGGAATTGCT TCAAGTACTA ACGCAACTGC ACCAGCTTGT TCTACATTTT 4 02 0 

TCGCGTCTAA AATAAGTTGc TCCGCTGCTT CTTTCGTTGC ACCTTGTAAT TTATACCCCA 4080 

TAACGCCAAC ACTTTGAGGT GTTAAT CCT A AATGTGCAAC AACAGGAATA CCAATTGCCG 414 0 

TTGCTTTTTC AATAAATGGT GTAATATGCG CTCCTTCTGC TTTAATTGCA TTTGCATTCG 4 2 00 

TCTCCTGATA AAGCTTTAGA GCATGATTTA AGTCTTGTGT CATAGAGATG CCTACTGCAC 4260 

75 

CAATCGGCAT ATCAACAACT ACAAATGTAT TTGGTGCGCC TCTTCTTACT GCACGACCGT 4320 

GATGAATCAT ATCTGCTAAC GTCACTTGTA CGGTACTTTC ATAACCTAAT ACAGTCATAC 438 0 

20 CAAGTGAATC CCCAACAAGA ATCATATCAA TACCCGCTGC TTCCACTTGT TTAGCACTTG 4 44 0 

GAAAATCATA AGCTGTTACC ATAGAAATTT TAGTTTG CTT TTGTTTCATA TCTATTAATT 45 00 

GACTTACTGT TTTCAATGTT ATTCAACCTC TTTTTGCAGT ATnATTAGA 454 9 

25 (2) INFORMATION FOR SEQ ID NO: 175: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 83 3 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 175: 

TTATCTTTTG TTGTTTCCTT AGACAAACGA CTAAC CACAT TATAATGGAC TAATTTATTA 6 0 

ATTTTATTTA ATT CCATTAA GTTATCCGTA ACACTAAGTG AAGATGCGGA GTTCACTCTC 120 

GTTTGTACTC TTCGTTTTAA TAAAGCACCT CGTAATAATA CAATCATTCT TCTTATTAAT 180 

GATGCTTGTC TATATACCTG TGTTCTTTCA GCATAACGCA TATAGTTTTC AAGTACACTA 24 0 

TTCGTTATTT GTCCTTCATC TACTAAAGAC TCTAATGTTT TkGTTTCTAC ATTAAAAGCA 300 

ATTTTTTGTA GACGTTCTAA TTCTTTAGAG TTTTCATCAT CTTTCTCTAC AGTTTTTAAA 3 60 

AATGCTAATT TATCATGATA TTCTTTAATC ACGTTACCAT ATTTAAAACT TGTTTCGAAA 420 

GTAGATTTTT GATTTAGATA ATCAATAACT TGTTCTAATA TATAAATTCT AGCAACTTTA 4 80 

AACGACATAT TGCCAATTAC TGTTTTAGGT GCAGGTTTCG TTAATAATGG CAATAATACT 540 

TGCGCAACTA CCAAACTAAT AATAACCATA CCAGATGCAA TAAATAATAA GTCGTTTCTA 600 
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ATTGTTC CAT GCACACCACA TAACGTCATA ATTAAAGCGT ATAAACTTCG CTTTGGTGGT 72 0 

TTCTCAGTCG TTGGATTATC ATCATCATTT TTAGTCATCA TTTTTTGGAA TGGACTGATG 780 

GCTAAATAAA AATAAGGATA TAAGACATAA ACCCAAACAA ATCTAAATAG ATAGACAGCT 84 0 

AAAGCAACAA CAATAGTGAT GCCTATTAAA AAGATTAAAT TGTGCGGTTC TGTTTTGATA 900 

ATTTTAATAA TAACTTCAGG TACTAAAAAT CCTAATATTG AAAAAACAAA GCCATTTAAA 96 0 

ACATAACCTA GTATATTCCA TGTATGATTG TAACTCATTT GCAGTTGTGT ACGTACTTGC 102 0 

ATAATTCTGT CACGTTCGAA ACCATGTACA AGTCCTGCAA CTACTGCTGC AATGATT CCT 108 0 

GATGCGTGaA ACAATTCAGC AATTAAATAC GTAACAAATG GTGTTAACAA TTGAATAATT 114 0 

GTAAACATAT TAATGTTTTC ATATCCTCGA CGCATCAATG TTAATCGGAA CCTTACTAAT 120 0 

GCCATACCTA TAAGTAAACC AACCACTGCG CCACCAATTG ATGCAATTAA AAACAACTGA 12 60 

ACAGCATCAA CAAGTGAAAA AGCACCTGTA ACTAATACTC CAACAGCTAT TTTAAATGAA 132 0 

ATAATACCAG CAGCATCATT CAATAATGAC TCACCTTCAA GAATTGTCAT TGCTCCTTTT 138 0 

GGCAAGACCT TTCCTTTAGT GATTGCTTGC ACTGCTACTG CATCAGTAGG ACAAAGAATG 144 0 

GCAGCAATTG CAAATGCTGC TCCAATAGGT AAATCTGGCC AAATCCAATG AATAAATAAA 1500 

CCTACACCTA TCACAGTAGT AATGACTAAT CCTAATGCCA TCATCATCAC TGGCTTAATA 156 0 

TATTTCCTTA AATGGACTCT AGAAACATTA ACACCTTCTA CAAATAACAA AGGCGCAATC 1620 

ATTGTTACCA TAAACAATTC AGAATCAAAA TTAAATTGAA CAGGGATTGG GGTAATAAAT 1680 

AGTAACATGC CCAAGAAAAT TTGTATAAAT GCTAGGGGTA CTTTAGGTAT GAAAGTATGG 174 0 

ACAAACGAAC TTAGTATCAC AACAGCTATA AATATAAGAA TTGTTTCAAA TATTTCCAAA 1800 

CTTTCACCTC TCTAAAAAGT ATTGTTTAAT TGAAAATTAA GTATCACATC TCGTTGTAAT 186 0 

TATACTTTAG AGGATAAATT GAGTTAGCGA CCACAAAAGC ACTTTAATAT AGATATATGT 192 0 

CTACGATTGC AGTACTTAAA TTTGCAATTA TTTAATTTTA TTTTATCACT AATTGTTTGT 198 0 

ATAAATAAAC AACTTGCTTT CACATAACAA CATTAACTTA TAATACAAAA AATGAGCACC 2 04 0 

TTAAAATCGA CTAACCAATT TCaAAGTACT CTTTTAATGA TTAATTTTGA AAACAGATTT 2100 

TCaAAAGCAT TGTTATGCTT AACAATTTAG CCAACACTTC AATCGTTTTG AT AC CATTT C 2160 

TTACGATGCT CTTCTCGTTT TTCAGCACGT AATTGTAATG CTTCTGTAGA GTTTTGTTCA 2220 

TTTGAACTTA ATAATATTGA TGCATGTGTG TGAGCATCAT TTTTT CGAT A CATATAAGCG 2 280 

CCGTTGCGAT AAGCAGCGCG AGCGACTAAG TGCATGC CGA CTGGTGAAGT TAAATTAATA 2 340 

AAAACAAGTG ACAGTAATAA ACGCACACTG AAAAATCCTG TATTCACAAT AAAATAAATT 24 00 
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CTTAAGAAAA CATCTTGGAA TTTCACGATA CCTATTGCAC TAATAAGAGC AATAAAACTA 2520 

CCTAACAACA ACATCACAGC AGCAATAAGA CTAAAGATTT CTTTTGTTAT TTCCATTAAA 2580 

5 

CACATGCCCC CCACCAATAA AGCGTGATAT TGAAACAGAA CTTACAAAAG ATATAATGGC 2 64 0 

AATGAG C ATG ATTGAATCTA AGAAAGAAAC GGTGCCCATA AGTACACTTA ACACACCCAC 2700 

AATTGACATT ACGACAGCAC TTGTTGTATC AAATGTAACG ACACGATCTG CTGTTGTAGG 2 760 

10 

TCCCTTGATT AATCTAAATA AACAGATGAT TAATGCAATT CCAAAAATAA TGAGTGAACT 2820 

AATAATCATA ATATGTGTTA TTGTTTGTAT CATCGCGACA CCTCCAATAT TAAGTCTTCA 2 880 

, 5 TAATGCTTAA TACTT CTTAA CAAACTATCT TTTTCTTTTT CTGACACGTC GATACTATGA 2 94 0 

ATAAAAAACT TTTTAGAGTC TTGAGAAATT CGTATTACTG TAGACCCTGG AGTTATAATA 3 000 

ATTAAAATTG TTAAAAATGT TATTGACCAA TCACTTGTTA GTCTTGTTTC ATATGAAAGT 3 060 

20 AATC CAGGGT TCATATCTTT TGTTTTAAAA AGAATATAAT TAATCGTGCT AATGCTAGAT 3120 

GTTATTAATT GATATAAATA AACACCTAAA AATTTAATAG CTAC CCATAT TTTTCTAACA 3180 

TAAAAATCAT CGCTGAAAAA CCTGTGTAAT ATATAAATGA CAATTAAACC AATTAGATAT 3240 

25 CCAGAAAAGA AAGTCGAGAA TTTAAAATGA TCTTCATCTT GAAATAATAC CCATAAGAAT 3300 

GCAATGATAA TATTTAAAAC TATTTGATTC ATTTAGTCCT CTCCTTTCAA ATG CGGATTT 3360 

ACAAGTTTTT GATATAATTG ATCACTCGTG TTCAACTCAG TTGCATCACT TGTAACATTT 3420 

30 AACACAACAG GTGCAG CAAT TCCGATTGCG ATAACCACAA CTACTAAAAT ACTTAAAATT 34 80 

CTTTTT CGAT ATAGCGGGAT TTTCTTAAAA TTAACTTCCT CCCCATCTTT ATCTCCAAAA 3 540 

TACATATAAA AAAGTATCCT AAATAAACTG TACATTGCAA TTAGACTAGT AATAATCATT 3600 

35 

AACGCTAGTC CAATATAATT GCCATTTTGC AATGCACCTT GGAAAATAAG TACTTTCCCC 3 6 60 

GGAA7AGC CAC TAAATGGAGG CACGCCGCCA ATAGCAAAAA TCATTATAAT AAACGCAACT 3720 

4Q CCAAATAAAG GTTCTTTTTT AGCTAAGCCA TTCAAATATT GATATTGTCG ATAGCCTGTA 3780 

ATGTAAACTA AACTAC CAAT AATAAAAAAT AGCAATGTTT TTACAACAAT GTCATTTACC 3840 

AAATAAAATA TTGCAC CATT AATACCTGCA AACGTGTTTG TTCCTAAACC TAAAATGATA 3 900 

45 AATC CTATTG AGATTATGAC TTGGTAAGCT GCAATCTTTT T AAT AT CTTT ATAAGCAATG 3 96 0 

ACACCTATAG CGCCGATGAC CATAGTTATA GCAGCCATAG TTGCTAGCAA TGGATGTATG 4020 

AGATCATTAT GTTGATCAAA TAGTAAAGTG AAGAATC GAA TTAATGCATA GGCCCCTACT 4080 

50 TTGGTCATTA ACGCTGCAAA TAATGCTGCA AGCTCAGTAT TTAACACAGC GTAGGCTTTG 414 0 

GGTAGCCACA TAAAAAGGAC CAGCGCTGCT TTCGCACTAA ATGCGACTAA GAAGATTAAT 4200 
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AAGTTTAATG TACCTACTGT TTTATAAAGT AAACCTATAC CTAATAAGAA TAGCCATGAA 432 0 

CCAATAATAT TCAAGACAAC ATAAATAATT GCAGCACGTA ATTGTT CTAC AGATTGTCCA 4 3 80 

AGTGTAATGA GTACAAATGA CGCTAGTAAC ATAATTTCAA ACATGACGTA TAAATTAAAT 4 44 0 

AAATCTGATG TTAGAAAAGA GCCTATCACG CCAACACTTA AAAATAATAT GAACGATGGC 4 50 0 

AAGTGATAAC GATTTG CTTT ATGTTCGCCA CGCCCAAATC CGTATGCCAT AATTAAAGTA 4 560 

ATCACAAACG AAGCGGTTGT AACCATAATT AAACTTAAAG AATCTCCTAA AAACTGTATA 4 620 

CCAAAGGGCG CTGACCATCC TCCAAAGTCT AGCGTAATTG GACGGTGACG CTGAACATAA 468 0 

ATTAATAGCA TTAATGAAAT AATTGTGGTG ATAGTCATTG TACCTAAGTA TAAATATTTA 4 74 0 

GAAATACGAT CATTATTTTT TAAAAATACA AGGATTAAGG CACAAAGGAA TGGTAATAAC 4 800 

ATTGGTAAAA TCAATAAGTT ACTTAGCATC ATCTTCCCCC CTTAGGCCTT CAATTTCATC 4 860 

TTCTTTTGTT ACTTTATAAG TTCTATAAAC AAGTACAAGT AAAAACGCAG TCATCCCAAA 4 920 

CCCTATAACT ATTGCAGTTA GTACAATAGC TTGTAACAAG GGATCAACAA ACAATTGGTT 4 980 

TCCACCAGTT ATTAGT GGTT CTGATCTACT AGAACCATAC GTTC CCATAC TCATAATAAT 5040 

GAGATTACCA GCATGAGTAT ATATTGAAAT TCCGATTACA ATACGAATTA AATTGATTGA 5100 

TAAAATCATA TATGTT CCTA TAAACACTAA AAATCCTATA ACTAGTAATA ATATTAAATT 516 0 

CATGATCGAC CTCCGCTAAG CGACAACATC ACTGTGACAA TAACACCAAC AACTGAGAAT 522 0 

AAAATACCTA ATTCAAAAAG TGTTATTGTA CTTACATGAA TTTGTC CTAA AATTGGAAGT 52 80 

ATCCAAGTTG TTTCATATTG AGACAAAAAT GGTTTTCCAA AAAACATAGG TATTATCGCA 534 0 

GTAATAGATG ATACCAATGC TCCAATAATC ATTAAAATTC TAAAATCAAT CGGTAAACTT 54 00 

TCTAAAACCT CTTCAACATT AAAAGCCAGA AACATTAAAA TAAACGCTGA ACTAAATATT 5460 

AAACCACCAA TAAACCCACC ACCAGGATTA TTATGACCTG CGAAGAAGAC ATAGAATCCG 5 520 

AAAGTCAATA AAATAAATAC AACAAGTTTC GTGACCGTTC TTAACACGAC ATCATTCTCT 5580 

TTCATCTTGT CCCCTCCGAT CTTGATAATT TAATAATGCg TAAATAC CT A GCCCAGTAAT 564 0 

AATTAACACT AATCCTTCAA ATAATGTATC TAATGCTCTA AAGTCACCAA GTATCGCATT 5700 

TACAATATTT TTACCACCTG TTAGTTTGTC AGCTTTTAAA TAAAAGTCTG ATATTGATGA 5760 

TAAACCATCT GTTTGTTGTG TAATAAAAAT TAATGATACA ACAATAAGTG CCATCAAGAG 5 820 

TGATACAGAA ATTTTAATTA TTTCTCTTTT TTTGTTAGCG TTAGATCTTG GCACGTTTGG 5 8 80 

TAATCTTGAA AAACTGACAA TAAATAGTAT CGTCGTTATT GTTTCAACTA CTAGCTGAGT 594 0 

CAATGCTAGA TCAGGGGCTT TCATTGCTAT AAAGAATAAG GTCACAACAA ATCCGATGAC 60 00 
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GACAGTTACG ATTGCTAATA TAATTTCTAA TGCCCCAAAT TCAGAAACAT GTAACTGATG 6120 

TACTTTAGGA AGTCCaATTC GAATATAACC ATATCCAATG AT AAT CATAA ATATGCCTAA 6180 

5 GGTCATAATA ATGTACTGGT TTAAACGATC TTGCATAACA CGTTTAAATC GCTTCGTAGC 624 0 

AAACTTTTCA AAATGTCGAT ATACCATCTC ATAGCTTTTT GAAACTGAAA TCTGTCTAAT 63 0 0 

TTTACCTGTG AACACTTTTT TCCAATCTAC TTTGATTGCT AGTACACTAC CCAATAAAAT 6 36 0 

W 

AATGATGATG GTTAAAAGAA GCGGTATGTT AAATCCATGC CATTGCGAAA CATGTGGTGC 64 2 0 

CAATTGATCA ATTTGATGAT TACCACCTGA TACAGCTCTT AATGCnAGAA CGATAATCCC 64 8 0 

CTTCCCAAAT ATATnTGGTA CAAAAAAGAT TACAGGTACT AGCACCATTA aTATAAGAGA 654 0 

ts 

TGGTAAACTA aACAACCATG GTTCGTGGAT ATTTTTTTTA GTAAAAACCT TAGAATCATA 660 0 

TTTTGCCCAA AATACTTCTT TTAC CATGTA TAGTGCATAT GTGAATGTAA AAACACTCGC 666 0 

2Q AATAACACCA ACAAACACGA TAGCTATCAT TGAAATCAAA CTAAATTGGG ATAATTGTCC 672 0 

AGTTTGTGTT AATGCATCTA AAAACATTTC TTTACTTAAA AAT CCATTTA AAAATGGTAC 678 0 

TCCAGCCATA GATAGAGCCG CTATCGTCAT GACTAGATTC ATTTTAGGAA ATAGTTGACG 684 0 

25 CATTCCACTT AAAATTCGTA TATCCCTTGA ACCTGCTTCA TGATCTAAAA TACCTACTCC 6900 

CATGAAAAGC GCACATTTAA AGATGGCATG ATTCATTAGa TGAAATAGcG CACCArATAA 696 0 

TACmAATACA TAAATaGATG CTATTGCGTC TTGTTGGTGT TGAG CATATC CGCCACCTAT 7020 

30 ACCCACCATA GCCATAATCA TCCCAAGTTG ACTGATTGTA GAGTACGCTA GGATACCTTT 708 0 

TAAATCCCAT TGTTTTAAAG CTGTAATTGA ACCAAATAAC ATTGTTATTA AACCAACAAA 714 0 

CGTAACGATA TATACGTACA TATTG CTAnG ACCTAATAAT GGTGTAAATC GAAGTAATAG 72 00 

35 

AAnGATACCA GCTTTTACCA TCGTGGCTGA ATGTAAATAA GCACTTACAG GTGTAGGTGC 7260 

AGCCATTGCT CTAGGTAGCC AGTATGAAAT GGAraTTGTG CTGATTTTGT AAATGCACCT 73 20 

AATAAAAACA TAAAAATCAT AGGGATAAAC AATCCATGAT TCTTAATATG ATCTGCTTGT 73 80 

40 

C CTAATATCT CTGTGATGTT ATTCGTTCCT GTCATGATAT ACAGCATAAT AAAACCAACT 744 0 

AATAACGCCA ATCCACCAAA TACTGTAATC ATAAATGATT GAATCGCACC AAATTGACTG 7500 

4s TCACCATTGT TATACCAATA TGAnATCAAT AAAAATGATG ATmCACTCGT TAATTCCCAA 7560 

AAaATGTACA TCmATATCGT ATTGTCTGAT AATACaaTAC CAAT CATACT GAACATAAAT 7620 

AACGTTAAAT AAAAATAAAA CCTTGGTAAA TTGTCTTTTC GAGAGGATAA ATATTGAGTT 768 0 

50 G CATAGAAG A ATACTGCAAT TCCAATAAGT GAAATAATAA GAGAAAACAT TAAACTTAAA 774 0 

CCATCTAAAC GTAAATCTAA ATTAATATCT AATGTCTTAA TCCATGGAAT AGAGGTAGAA 780 0 
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GGTGCAACCA ACGCTATGTA CCCGGCATAT TTAGCCAATG CTCTACGTTT AGACATTAGA 7 920 

AGTATCATCG CCATAATCAC AAGTATAGCA ATTAATAAAT AAACCAAACT CATTATTAGC 7 98 0 

CTCCTTTGTT TCTATAATTG TAATGAAATA TAAATACTAT GTTCACACTC ATTTTCTAAA 8 04 0 

CCGATAAAAT TTAGTGTTTC AATAG CAG AT TGATGCCCTA AATACTTTTG AATGACTGGT 8100 

ATAAGTATAC C TTTT TGATA AGCATGATAT GCAAATGTCT TACGCAATGT CGTTAGTCCT 816 0 

ACATTATCTA TACCAGCTTC AATTGATGCT TGGTGAATTA TTCGATATGC TTGCTGTCTA 822 0 

GATAATACTT GATTTGTTCG TAGTGATTGA AAAAGAACGT CTTCATTCGA AAGACTCCTG 828 0 

TCCTCTATAT ATTGAAGTAG TTCTTTCGAT AATGTTTCTG GTAACCTAAT TTTAATCAA 8 33 9 
(2) INFORMATION FOR SEQ ID NO: 176: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 588 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 176: 

CCCGATTTTT TTACGTAATC TAATACATAC GGCAAAATCA ACTTTAATCA AAAAAGACTC 6 0 

ATACACAATG CCTTTAAAGC ACATGTATGA GTCCTTTTTA GTAGTTTATA TCAAAAAATA 12 0 

GTTTAATGTA TAAATTAGTT TTTGTTTACA GATGCGTCGT AGATTGATTC TACAGCATCA 180 

CCTAAAGCTT TATCGAATTC TTCTTTAGAT TGATCAGCTC TTAAATCACT AGCTAATGCA 24 0 

CGTGAGAAAC TTGCGATAAG TTCAGCGTTA TCTTTAAGTA ATTCATTTGC TTTTTCTCTG 300 

CTGTAACCAC CTGATAATAC AACGACACGA ACAACATTAG GATGTTCAGC TAACTCTTTG 3 60 

TATAAGTTTG GTTCAGTAGG AATTGTTAAT TTCAACATTA CTAATTGATC AGCATTTAAG 4 20 

CTATCTAAAC CTTTTTTAAG TTCAGCTTTT AATACTTTTT CAATTTCAGC TTTGTCTTTT 4 80 

GCATTAATAT TAACTTCTGG TTCGATAATT GGAACTAAAC CTTTAGCAAT AATTTGTTTA 54 0 

GCAACTTCAA ATTGTTGTTC AACAACGTCT TTGATACCTT GCTCATTT 5 88 
(2) INFORMATION FOR SEQ ID NO: 177: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2841 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ATAGAGTnCT GGnACTTACT ATGACATATG GCG CTAGAAT GGCTGAGCCA GGTGAATTTA 60 

CAAAA CGTGC CTTTTTAAAT GGTCGTATTG ATTTATCTCA AGCTGAAGCA GTTATGGACT 120 

5 TTATTCGCTC GAAGACAGAT AGAGCTTCTA AAGTTGCGAT GAATCAAATT GAAGGTCGTC 180 

TAAGTGACTT AATCAAAAAA CAACGTCAAT CTATATTAGA GATACTCGCT CAAGTGGAAG 24 0 

TGAATATTGA TTAT CCTGAA TACGATGATG TTGAAGATGC GACTACTGAA TTTCTTTTAG 3 00 

'° AGCAGTCTAA AGAAATCAAA CAGGAAATTA AT CGTTTATT AGATACCGGT GCGCAGGGTA 360 

AAATTATGCG TGAAGGTTTA TCTACAGTTA TTGTTGGTAA ACCAAACGTA GGTAAATCAT 4 20 

CGATGTTAAA TAATTTAATA CAAGATAATA AAGCGATTGT AACTGAGGTA GCAGGTACTA 4 80 

' 5 CTAGAGATGT CTTAGAAGAG TACGTCAATG TTCGTGGCGT GCCATTAAGA TTAGTTGATA 54 0 

CTGCTGGTAT ACGTGAGACA GAAGATATAG TAGAGAAGAT TGGTGTTGAA CGCTCTAGAA 600 

AGGCTCTTAG CCAAGCAGAC TTAATTTTAT TTGTATTAAA CAATAACGAA GCATTGACwC 660 

20 

AAGAAGATTA CACATTATAT GAAGTGGTTA AAAATGAAGA TGTAATCGTA ATTGTTAATA 720 

AAATGGATTT AGAGCAAAAC ATAGATATTA ATGAAGTTAA AGATATGATA GGTGATACGC 78 0 

CATTAATTCA AACTTCAATG TTAAAACAAG AAGGTATTGA TGaATTAGAA ATACAAATT C 84 0 

gAGATTTGTT CTTTGGTGGa GAAGTACAAA ATCAAGATAT GACTTATGTT TCTAATTCAA 900 

GACATATTTC AT T ATTAAAA CAAGCAAGAC AAACGATACA AGATGCGATT GATGCAGCAG 96 0 

3Q AATCTGGTGT GCCTATGGaT ATGGTACAAA TTGATTTAAC TAGAACTTGG GAAATATTAG 1020 

GAGAAATTAT TGGTGAGACT GCAAgTGATG AACTCATCGA TCAGTTATTC AGTCAATTCT 108 0 

GCTTAGGTAA ATAGTAATTG AAATAGACGG AATACCGTCT TAAGAAGGCT AGTAAGATAT 114 0 

35 CAAATAAGGA G GTTTAT ATT GTGGTTCAAG AATATGATGT AATCGTTATA GGTGCGGGAC 1200 

ATGCAGGTGT AGAAGCAGGT TTAGCATCTG CAAGACGTGG TGCTAAAACA TTAATGCTAA 126 0 

CAATAAATTT AGATAATATT GCATTTATGC CATGTAACCC ATCTGTAGGT GGACCAGCTA 132 0 

40 AAGGTATCGT TGTTCGTGAA ATTGATGCTT TAGGTGGACA AATGGCAAAA ACAATCGATA 1380 

AAACACACAT TCAAATGAGA ATGTTAAATA CAGGTAAAGG ACCTGCTGTA AGAGCA CTAA 144 0 

GAGCGCAAgc AGaTAAAGTA CTTTATCAAC AAGAAATGAA A CGCGTGATT GAAGATGAAG 150 0 

45 AAAATTTGCA TATAA TGCAA GGTATGGTAG ACGAACTTAT TATAGAAGAT AATGAAGTTA 156 0 

AAGGTGTACG TACAAATATT GGTACAGAGT ATTTATCTAA AGCAGTAATT ATTACAACGG 1620 

GAACATTTTT ACGTGGTGAA ATCATTTTAG GTAATATGAA GTATTCAAGT GGACCAAATC 1680 

SO 

ACCAATTACC ATCAATCACA TTATCAGACA ATTTAAGAGA ACTTGGTTTT GATATTGTTC 174 0 
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AAATACAACC AGGTGACGAT GTAGGT CGTG CATTCAGCTT TGAAACAACA GAATATATAT 18 60 

TAGATCAATT GCCATGTTGG CTAAC GTATA CTAATGCTGA AACACACAAA GTTATCGATG 19 20 

ATAATTTACA TCTATCTGCA ATGTATTCAG GGATGATTAA AGGAACCGGG CCACGTTATT 198 0 

GCCCTTCAAT TGAAGATAAA TTTGTTCGAT TTAATGATAA GCCGCGACAT CAACTTTTCT 204 0 

TAGAGCCTGA AGGTCGTAAT ACAAATGAAG TATATGTGCA AGGATTGTCT ACAAGTCTTC 210 0 

CTGAACATGT GCAcGTCAAA TGTTAGAGAC GATACCAGGT CTTGAAAAAG CAGATATGAT 2160 

GCGTGCCGGC TACGCAATTG AATATGATGC GATTGTGCCA ACGCAGTTAT GGCCTACACT 222 0 

TGAAACGAAA ATGATTAAAA ACTTATATAC TGCAGGTCAA ATTAATGGTA CATCTGGTTA 2280 

TGAAGAAGCA GCAGGACAAG GATTGATGGC AGGTATTAAC GCTGCAGGTA AAGTGTTAAA 234 0 

CACAGGCGAA AAGATATTAA GTCGTTCAGA TG CAT ATATT GGTGTCTTAA TCGATGATCT 24 0 0 

TGTAACTAAA GGTACTAATG AA CCTTATCG TTTACTAACA TCACGTGCAG AATATCGTTT 2460 

GTTAcTACGT CATGATAATG CTGATTTGAG ATTGACGGAT ATGGGATATG AACTTGGTAT 252 0 

GATTTCTGAA GAAAGATATG CACGTTTTAA TGAAAAACGT CAGCAAATTG ATGCGGAAAT 2580 

TAAGCGTTTA TCAGATATTC GTATTAAACC AAACGAACAT ACGCAAGCGA TTATTGAACA 2 64 0 

ACATGGTGGT TCTCGCTTAA AAGATGGTAT TTTAGCTATC GATTTATTAC GCAGACCTGA 2700 

AATGACTTAC GATATAATTT TAGAACTTTT AGAAGAAGAA CATCAATTGA ATGCAGATGT 2760 

TGAAGAACAA GTAGAAAT A C AAACAAAATA TGAAGGTTAT ATCAATAAAT CACTACAACA 2 820 

AGTTGAGAAA GTTAAGCGTA T 2 841 

(2) INFORMATION FOR SEQ ID NO: 178: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3025 base pairs 
T (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 178: 

ATCTAATTTC AAACCCGGTG ATAAATTGCC AAGCGTGACG CAATTAAAAG AACGTT AT CA 6 0 

AGTAAGTAAG AGTACTATCA TTAAAGCATT AGGCTTATTG GAACAAGATG GTTTGATCTA 120 

TCAAGCACAA GGCAGTGGTA TTTATGTGAG AAATATTGCT GATGCCAATC GTATCAACGT 180 

CTTTAAGACT AATGG TTTCT CTAAAAGTTT AGGTGAACAC CGAATGACAA GTAAGGTACT 24 0 

TGTTTTTAAG GAGATTGCAA CGCCACCTAA ATCTGTACAA GATGAGCTCC AATTAAATGC 3 00 
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CGAATATTCT TATTATCATA AAGAAATCGT GAAATATTTA AATGATGATA TTGCTAAGGG 420 

CTCTATCTTC GACTATTTAG AATCAAACAT GAAACTTCGT ATTGGTTTTT CAGATATTTT 4 80 

5 CTTTAATGTA GATCAACTCA CTTCAAGTGA AGCTTCATTA CTACAATTGT CTACAGGTGA S4 0 

ACCATGTTTA CGTTACCACC AGACTTTTTA TACAATGACT GGCAAACCCT TTGATTCATC 6 00 

TGACATCGTA TTTCATTATC GTCATGCACA GTTTTATATT CCTAGTAAAA AGTAATAAAT 6 60 

'° ACATAAAAAC GTCTATATCC CAGTTATAAA CTGGAGTATA GACGTTTTTT TACGATAATA 72 0 

ACAATGGCTC AAATTGCTAT TATCTTGCTT AGGTTTTTCG TTTTAGAAGA ATATTGCTAC 7 BO 

AAAGACAGGC ACAACTGCTA CAACAACTA C ACCAACTAAC ACTAAAGCTA TACTTGCCAT 84 0 

15 

TGATTCTTCT ACAGGTCCTA ATTCTTTGGC TGGTGCTACA CCTAATGTGT GACCACTTGT 90 0 

TCCAAGTGCT AATCCTCGGG CAATAGGGTT AGTAATTCGG AAAAGCTTTA AGAATTTATT 9 60 

ACCTAGGGCA TAAATAATGA CACCATTTAA AATAACTGCT AATGATGTTA ATTCTTTTAT 102 0 

20 

ACCACCGATA CCAGCTGATA CTGGTAACGC AATCGCTGTA GTTGCTGCTT GAGGTAACAT 108 0 

TGATAAAATA ACATCATTGG CAAATTGTGC TAACTTCGCA AAAGTTAAAA TAATTAATAA 114 0 

25 CGCTACAACT GTACCGATAC CAATACCTCC GATGATACGA TGCCAATGTT TAACAAGCAC 1200 

TTCACGCTTT TTATATAACG GAATCGCAAA ACAGATTGTT GCCGGTTCTA AGAAGAAGTA 1260 

AATAATGTCT CCACCTATTT TGTAAGTCTT ATACGGAATG CCTGTTAAAT AGAGGAAGGC 132 0 

30 CACACCAAAT ACCATACTGA CAAATAGCGG TGCGAATAAG AAGAAACGAT TAGT TTTTT C 1380 

AAATAATATG GTCGCTAAGA AAAATG GTAT AACGGATAAC AGTATTCCGA AGTAAGGTGT 144 0 

GTTTaGTGCT AAGTGGTTAA TCaTGAGCTT GTGCCTCCTC TATTTTGATC TTTTTTGTGA 1500 

35 CTTTGTCACC TTTAGATCTC GAAGTAACTT TCATAATAAT TTgTGTGACA TAGC CAGTAC 156 0 

AAATAAGTAA TAGTATTGTT GAGACGATTA TTAGTCCAAT GATTAAAAAT GGTG CTTGGC 162 0 

TAATGACACC TAAAGAGTTA ACAACTGAGA TACCGGCTGG TACGAAGAGT AAGCCAATGT 168 0 

40 TATTTGTTAG TGTCGTTCCT ACTTTTTCGA CTTCGCCTAA CTTAACAGCA CCAGTACATA 174 0 

ATAATACAAA TAATAATACT AAACCGATTA CTGATGCAGG CATAGGAATT GGCATAAATG 1800 

ATTCAATTAT TTTCGATACA AAGAGTACTA AAGCAATTAC AATGACTTGG TGAAAAAAGT 186 0 

45 

GTGCTGGTTT TGATGCGTCT TTTTGTTGTT TCACGACCAT TGCCTCCTAC GTTTGATTTA 192 0 

ACTAAAGTAT AGATGGCTCA CTTCGATTTG CGTGATTTTT AGTC CGAAAT ACAAAATATC 1980 

ATAGGTAAAA TGCATAAAAA AAAGGATTAC TGTTAAAGTA ATCCTATCGA CGCTTTAAAA 2 040 

50 

TCTTTCATAA ATGAACGTCC AACTTGCATC TTGACAC CAT TTGTCAATAT TACCATATAA 2100 
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TGAATACGTA TAAAATAAGT GGGATTCAAT CGTTTTTCAT AACGATTCAA TGGCTCTGTT 22 2 0 

GTTTCGTATT TATGATTCGT TGTATGTATG GTTGTAATAC CATTATGTGT GCCAATCCCA 2 280 

ATAATATTTT GTTGCTTTAA CATGTGAATT TTATCGTCAA TTTCAACAGG TAAG CTTTGA 2 34 0 

TCAAAATTCG CCGACATATC ATTCGCAATT GCACTTGCGT TATTATCATC TTTGG CTTTA 24 00 

GTCGCACGCA CTTTATTGAC TGCTTGTTCA ATACGTTTTT GACCAAACGG TTTCAAAATA 2460 

TAGTCTGTCG CATTTAATTC AAATGCCTGT ACTGCGTATT GGTCATGTGC AGTTGCAAAA 2520 

ATAATCGCAG GTGGCTCTTT CATCTTTTGA ATCTTAGCTC CTAATTCGAT CCCATTTTCA 2 580 

TCCATTAAAT TGACATCTAA AAATATAATG TCATATTGAT TGATCAGTAG TG CTTCCAAT 2 54 0 

GTTTCTTTTA CATTTTCTGC CTCATTAATT TCTTCAAAAC CACCAATTTC ATTTAATAAA 2 700 

TATGTTAATT CATTACGTGC TAATGGCTCA TCATCTATGA TTAATGCTTT CATATTTATT 2 760 

CCTCCTCTTG TCTTTCATAA GGAAGTACAC ACCAAAAAGT GGTACCGCTC GATGTCGATT 2 820 

CAAATTGTAA TGCTGCGGAT TTTCCAAATA ATCCTTTTAG GCGTAAGTTT AAATTTTCTA 2880 

AAGCACTACC AGTTCCAGAC TCTGATTCTA CAGATGTnTC TCCCaACAAA TG CATTTT AT 2 940 

CTTTAGAAAT ACCCTGACCA TTATCTTGTA CAATAATACG TACATGTGTT GCAGTTTCTT 3 0 00 

TAAT CACTG A CACGTCAATA TCGTT 3 025 
(2) INFORMATION FOR SEQ ID NO : 17 9: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1689 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

-(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 179: 

ACAGAATTTC ACAGCATTTT TAGATGAAAA AATAAGCCAG TCATAG CGTT GATTTAACAA 6 0 

ATGAATATCA AAATTTAGTG GCTTTATATC AATAAAGGGT TTGTGAATAA TTGATACTAA 12 0 

ATCACTTTGC ATGTCATTTG TTTGTGTCAT AACTACAACT GGCTTCATAT TTAAACGTCA 18 0 

CTCCATTATT TAATGTTGTT CATTTAAGCG TTTTATAATT TCATAAGCAC CTTGCTCTTT 24 0 

TAATTTGTTA CTCACTGTTT TGCCTAACTC AACCGGATCT GTTCCGTTCA TTGTATATTC 300 

AAATCGTTCT TTACCATCTG GGGTCATAAT TAAACCTGTA AATTCGATTT CGTTTTGATC 3 60 

TGAGATTGTA GCATATCCTG CAATTGGCAC CTGACAACTA CCATCCATTT CTGCTAAAAA 42 0 

CGTTCGTTCA GCAGTCACAC ATTTTGCAAC CTCATCATTA TGTACTTTGC TTAATAATGT 480 
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TAACAATGTA TCTCTATCAA GATAAGATGT TnCAATATCA TCTGACCAGC CCATTCTTCT 60 0 

TAAACCAGCT GCAGCTAAAA TAATCGCATC ATAATCTTCA GTTTGTAACT TTTCTAATCG 66 0 

5 TGTATCTATA TTACCTCTAA TCCATTTAAT CTCTAAATTA GGATACTTAG ATAATATTTG 720 

TGCAC CACG A CGTAATGAAC TAGTACCAAT AATACTGCCT TCTGGCAATT GGGATAGTGG 780 

TGTATGTGTT TTAGAAATAT ACGCATCAAA AGGTAATT CT CTATCAGGGA TACAACCTAA 84 0 

to 

tgttaaacct tccggaatta cacttggtac gtctttaagc gagtgtattg ccatatcgat 90 0 

atttttttca aaaagttcat gttgtatttc tttaacaaat aagcctttgc ctccgacttt 96 0 

j5 agacaattgt ttatctacta tacgatcgcc tttcgtgaca atttctttaa tttcaatttc 102 0 

tagatttggc tcgacagctt ttaatttatc aataaattgc tggctttgtg ttaaagctaa 108 0 

tttacytctt ctggagccaa cgactrattt acgcatgttc aattcctcct aggaacggat 1140 

20 tgctctagat tattttctca attcacaaaa tgtgttgcaa aaaataaatt aatcatattt 12 00 

aagcaaaata aaataatgtt atagtatatt aaatatcttg aattcaacca tttgttgatt 126 0 

ctaagtaaaa tataacttcc atataatact gtaataattg aagagagtat tac cttcggg 132 0 

2s tcaatgaata tacgttcacc aactgaaatt acaccccact gtgtacctaa aataatacta 13 8 0 

aatatgagaa ttatccaccc acttaacgtt gagtaaaaca caattgattc aagtgtagca 144 0 

acgctaccaa ttctaaagta tttttgatca aaacgttttt ccttcaaatt acggtattgc 150 0 

30 atgatataca gtaatgcatt gacaaaagct aagg caaaga agacataact taacacagct 156 0 

agaccgatat ggactaacag taactcgtct ac aacag caa ttttctgaac cttattagta 1620 

taatgtgtcg gttgaaatgt attcatccct aanagtgtta accctattaa attc caagg a 168 0 

35 aaaacacag 1689 
(2) Information for seq id no: iso: 
(i) sequence characteristics: 

40 (A) LENGTH: 1209 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 180: 

nTGGnTGGCT TTTCCTATTG GACCAAATGG ACCnTTTACC TGGCCnTTCC CAGGACACCC 6 0 

50 CGCTTGTGCC CACATTC CAA TCGGAAAAGG TGTATGTGGT ACAGCCGTTT CAGAACGTCG 12 0 

TACACAAATT GTAGCTGATG TTCATCAATT CGAAGGACAT ATCGCTTGTG ATGCTAATAG 180 



55 



EP 0 786 519 A2 



CGATGCCCCT ATAACGGATC GATTTGATGA CAATGACAAa GAaCATCTTG AaGCAATTGT 3 00 

TAAAATTATT GAAAaGCAAC TCGCATAAAA GGACATCAGC ATTTTCAATA AAGTGTTGAC 36 0 

AGTTAGCAGG AAAATGTTAC AATAATCTTT GTGT GAATTA ACGAAAGTAG CAGTTGTATA 42 0 

TTATTGAGCG CTATGTTGTT CCCAATGCGG ACGTGTCACG TAACTGTCGC TATAAGG TGA 48 0 

AGACA CATAA AACAATATAT CTTAGTAAGC ATGCAACACT CTTTTTTGTT TATTCATAAC 54 0 

AACAAAAAAG AATTAAAGGA GGAGTCTTAT TATGGCTCGA TTCAGAGGTT CAAACTGGAA 6 00 

AAAATCTCGT CGTTTAGGTA TCTCTTTAAG CGGTA CTGGT AAAGAATTAG AAAAACGTCC 66 0 

TTACGCACCA GGACAACATG GTCCAAACCA ACGTAAAAAA TTATCAGAAT ATGGTTTACA 720 

ATTACGTGAA AAACAAAAAT TACGTTACTT ATATGGAATG ACTGAAAGAC AATTCCGTAA 780 

CACATTTGAC ATCGCTGGTA AAAAATTCGG TGTACACGGT GAAAACTTCA TGATCTTATT 840 

AGCAAGTCGT TTAGACGCTG TTGTTTATTC ATTAGGTTTA GCTCGTACTC GTCGTCAAGC 900 

ACGTCAATTA GTTAACCACG GTCATATCTT AGTAGATGGT AAACGTGTTG ATATTCCATC 960 

TTATTCTGTT AAACCTGGTC AAACAATTTC AGTTCGTGAA AAATCTCAAA AATTAAACAT 1020 

CATCGTTGAA TCAGTTGAAA TCAACAATTT CGTACCTGAG TACTTAAACT TTGATGCTGA 1080 

CAGCTTAACT GGTACTTTCG TACGTTTACC AGAACGTAGC GAATTACCTG CTGAAATTAA 114 0 

CGAACAATTA ATCCGTTGAG TACTACTCAA GATAATACGG TCAATACCAA CACCCACAAT 12 00 

TGTGGGTGT 12 09 
(2) INFORMATION FOR SEQ ID NO: 181: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6 98 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 181: 

AAATCCCTTt GTtaAAgTsC AAAtTTTTCc AACrgCTTTA AtArGACCCA TATTACCtTC 6 0 

TTGGATTAAA tCmAGGaATG AcATACCACG ACCaCGTATC TTTTAGCAAT ACTTACAACT 120 

AAACGTAAGT TCGCTTCTGC AAGTCTTGAT TTTGCTACTT CATCACCTTG TTCAATACGT 180 

TTGGCTAATT CGATTTCTTC TTGTGCACTT AATAAGTTAA CACGCCCAAT TTCTTTAAGG 240 

TACATACGAA CTGGGTCATT TATTTTAACA CCTGGAGGGG CACTAAGATC ACTTGGATTC 3 00 

AGTTTCTCGT CAGTAT CTGA ACTATCTTTT TCATTAACTA GTGAAATATC ATTATCATTT 360 
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GCAATTTCTT CATGACTTAA ATGACCCTCT TTTTTACCTT TTTCAATTAA TTGCTTCTTA 4 80 

ACATCTTCTA ATGTTAATGT CGGATCAATT GTTrGTTTTT TAATTTTAAC TGTGTTATCA 54 0 

5 

GACATGAAAC GGCCTCCCGA TTTTAAATAT GAACATTCGA AATTTATTCA ATATTG CT AT 600 

TTTAAACGAA ATTCTTAATT AATTCCATCC ATATTTTnAA TTTTATTTTA CAAATTGGGA 660 

ACTAAATCCC CAATATTTAT TTTTCAATAG TGGTGGTT 698 
(2) INFORMATION FOR SEQ ID NO: 182: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 5147 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 182: 

ACTTGATGAT GTATACAATG TATTTCAAGA ATATTATCAA AAAACAT CTA ACATTAAGTT 60 

TTGTAGAATT CACAATTCTA GCTATTATCA CTTCTCAAAA TAAAAACATC GTTCTTCTTA 120 

25 AAGATTTAAT TGAAACAATC CACCATAAAT ACCCTCAAAC TGTTAGAGCT CTCAATAATT 180 

TAAAAAAGCA AGGCTATCTA ATAAAAGAAC GCTCAACTGA AGATGAAAGA AAAATTTTAA 24 0 

TTCATATGGA TGACGCGCAG GAAGACCATG CTGAACAATT ATTAGCTCAA GTGAATCAAT 3 00 

30 TATTAGCAGA TAAAGATCAT TTACATCTTG TTTTTGAATA ATATCTCTAT TACGCAAGTG 360 

TGCTGTATTC TAAAGTGCAC TTGTGTTTTC TATTTTTTAA TAAAACCTCA GCACATAATG 420 

AACAACTTTC TATTTTCTAT ATCACTTAAA ACCATTTCCG AAATTAAACC TCAGCACATT 480 

35 CAAAGCCCCA CTTTATTCTT AAAAATATTT TTTAACTCAT ATGTATTAAA CCGCTTTCAT 54 0 

TATAAAAAAT ATCTCTATAT TtTATCTGtT Tt TATTAATC GAAATAGCGT GATTTTGCGG 600 

TTTTAAGCCT TTTACTTCCT GAATAAATCT TTCAGCAAAA TATTTATTTT ATAAGTTGTA 66 0 

AAACTTACCT TTAAATTTAA TTATAAATAT AGATTTTAGT ATTGCAATAC ATAATTCGTT 72 0 

ATATTATGAT GACTTTACAA ATACATACAG GGGGTATTAA TkTGAAAAAG AAAAACATtT 7 80 

ATTCAATTCG TAAACTAGGT GTAGGTATtG CATCTGTAAC TTTAGGTACA TTACTTATAT 84 0 

45 

CTGGTGGCGT AACACCTGCT GCAAAtgctG CGCAACACGA TGAAGCTCAA CAAAATGCTT 900 

TTT AT CAAGT CTTAAATATG CCTAACTTAA ATG CTGATCA ACGCAATGGT TTTATCCAAA 96 0 

so G CCTTAAAG A TGATCCAAGC CAAAGTGCTA ACGTTTTAGG TGAAGCTCAA AAACTTAATG 102 0 

ACTCTCAAGC TCCAAAAGCT GATGCGCAAC AAAATAACTT CAACAAAGAT CAACAAAGCG 1080 
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AAAGTCTTAA AGACGACCCA AGCCAAAGCA CTAACGTTTT AGGTGAAGCT AAAAAATTAA 12 0 0 

ACGAATCTCA AGCACCGAAA GCTGATAACA ATTTCAACAA AGAACAACAA AATGCTTTCT 12 6 0 

£ ATGAAATCTT GAATATGCCT AACTTAAACG AAGAACAACG CAATGGTTTC ATCCAAAGCT 132 0 

TAAAAGATGA CCCAAGCCAA AGTGCTAACC TATTGTCAGA AGCTAAAAAG TTAAATGAAT 13 8 0 

CTCAAGCACC GAAAGCGGAT AACAAATTCA ACAAAGAACA ACAAAATGCT TT CTATG AAA 144 0 

TCTTACATTT ACCTAACTTA AACGAAGAAC AACGCAATGG TTTCATCCAA AGCCTAAAAG 1500 

ATGACCCAAG CCAAAG CGCT AACCTTTTAG CAGAAGCTAA AAAGCTAAAT GATGCTCAAG 1560 

CACCAAAAGC TGACAACAAA TTCAACAAAG AACAACAAAA TGCTTTCTAT GAAATTTTAC 1620 

75 

ATTTACCTAA CTTAACTGAA GAACAACGTA ACGGCTTCAT CCAAAG CCTT AAAGACGATC 1680 

CTTCAGTGAG CAAAGAAATT TTAGCAGAAG CTAAAAAGCT AAACGATGCT CAAGCACCAA 1740 

2o AAGAGGAAGA CAATAACAAG CCTGGCAAAG AAGACAATAA CAAGCCTGGC AAAGAAGACA 1800 

ACAACAAGCC TGGTAAAGAA GACAACAACA AGCCTGGTAA AGAAGACAAC AACAAGC CTG 1860 

GCAAAGAAGA CGGCAACAAG CCTGGTAAAG AAGACAACAA AAAACCTGGT AAAGAAGATG 192 0 

25 GCAACAAGCC TGGTAAAGAA GACAACAAAA AACCTGGTAA AGAAGACGGC AACAAGCCTG 1980 

GCAAAGAAGA TGGCAACAAA CCTGGTAAAG AAGATG GTAA CGGAGTACAT GTCGTTAAAC 2 04 0 

CTGGTGATAC AGTAAATGAC ATTGCAAAAG CAAACGGCAC TACTGCTGAC AAAATTGCTG 2100 

30 CAGATAACAA ATTAGCTGAT AAAAACATGA TCAAACCTGG TCAAGAACTT GTTGTTGATA 216 0 

AGAAGCAACC AGCAAACCAT GCAGATGCTA ACAAAG CTCA AGCATTACCA GAAACTGGTG 2220 

AAGAAAATCC ATTCATCGGT ACAACTGTAT TTGGTGGATT ATCATTAGCC TTAGGTGCAG 22 80 

35 CGTTATTAGC TGGACGTCGT CGCGAACTAT AAAAACAAAC AATACACAAC GATAGATATC 234 0 

ATTTTATCCA AACCAATTTT AACTTATATA CGTTGATTAA CACATTCTTA TTTGAAATGA 24 00 

TAAGAATCAT CTAAATGCAC GAGCAACATC TTTTGTTGCT CAGTGCATTT TTTATTTTAC 24 6 0 

40 TTACTTTTCT AAACAACTTC TGAAACGCCT CAACACTTTC TACTCTGATT ACATATATGA 252 0 

CATTTTTAGG CATTAAAAAA TCGAACTAGA CAAGATGCTC ATTGCATTTC GTACTAGTTC 2580 

GATTCATGAA TAATTAGATT TAAAATGTCA TTTGAATCCA AGTGACAACA TTATTTATAT 264 0 

45 

TTAGAATATT AACGTTAGTA TAAACGTCCA AACACAAATA AAAGCAACAA ATATAATACT 270 0 

GTATTTTAAC GTCATTTTTA ATAATGCAGA TTCTTCACCA ACTTTTTTAA CAGCTGCAGT 276 0 

CGCAATGGCA ATTGATTGTG GTGAAATAAG TTTCGCTGCT ACACCACCTG CAGTGTTAGC 282 0 

SO 

TGCCACAAGT AATGAACCGC TTGTTGAAAT TTGTTGTGCC ACTGTCGCTT GAATAGGTGC 288 0 
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TGGAGAGAAT AATGGGAAAA TTGCTCCCGC TTTAGCAATA CCTTGTCCAA TTGCTACAGT 30 00 

CAAACCACCG TATGTCATAA CTTTAGCAAT AGCTAGGATA GCTGAAATTG TAAGG AT C GG 306 0 

TAACCATAAT TCTTTAATTG CTTCGACCAA TAAAGCACCT GCACTTTTCC ATTTTAACTT 3120 

CGTAATTAAA ATTGTAATAA TTACTGTTAA TAAAATCGCT GTCCCAGTTG CACCAATTAA 318 0 

ATCGAGACGC AACG CAATTC CTTTAGGCGA TAAATCACTC ACAGTATTTG GAATTGGCAA 324 0 

TTTTATTACT AAACTTTCAA GTGCACCTCC AGGTTGGAAT AATTTTTTGA AGAATGGTGC 33 00 

ACTCCATACT AATACAAAGG CAGTTAAAAT TACGAACGGA CTCCAAGCAA AGACAATTTC 33 60 

TTTAGGCGTT CGTTTTTGAA TTTTATG TTC AGACGCTTCC AATCTGAAAA TGTTTTTCGG 34 20 

TTTAAATTTA CGACAAACAA ATGCTAACAC CACCATTGTT GCTAGTGATG GAATAATGT C 34 80 

TGCTAGTTCT GGACCATGGA ATATTGTTAA TAATAATTGT AAT CCAGTAT ATGTACCACT 354 0 

CACTGTTAAA ATGACAGGTA AAATTTCTTT AATACCTTTC ATACCATCTA CAATGAATAC 3600 

TAAAACAAAT GGAATAATAA AGTTTAAAAT TGGAAGTGTT AATGCTGAGT ATCTCGCAAC 366 0 

ATCTAATGTT GTAACGCCTC CACTTAAGTT AAACGTATCA ATAATACTAA CTGGTAAACC 372 0 

AATTGCACCA AAGG CACCCG CCGCACCATT AGCAATTAAA CATAACATCG CTGCTTTTAA 37 8 0 

TGGTTCAAAT CCAAGTTGAA TTAATAATAC TGCACAAATC GCAATTGGCA CACCAAATCC 384 0 

TGCTGCACCT TCTAAAAATG CGTTGAAACA AAATCCAATT AATAATAGTT GGATTCTTTG 3900 

GTCCACTGAA ATACTTGCAA TACTATCTTG AATAATAGAA AATTGTCCTG TTTTAATAGA 3960 

AACTTTATAT AACCAAACTG CCATTAAAAC GATATATCCT ATTGGGAAAA TACCGGCAAC 4020 

AACGCCTTCT GTAATCGCAC CTGCTGATAC ACGCGCTGGT AATTCAAATA CAAATAAAGC 40 80 

CACAATCAAT GTAACAACCA AAGTTGTCAA TGCTGCATAA ATGCCTTTCA TTTTAAAAAC 414 0 

GGTTAAGCAT AATAAAAATA AAATAATAGG TACTGCTGCA ACT AAGG CTG ATAATCCGAC 42 0 0 

ATTATCGAAT GGATTTACAG TAAGTAGTGT CATAATGACT CCCTCTCTTT ATATAAAATA 4260 

TTTATCATTC TGATTAATCT ACAACCTATT TCAACTTATA TTTTGCGATG ATCACATATT 4320 

TAAAATGTAA CACTCCTATA TGTGACAGGC AATCGAATTT TTACAAAAAG TTCACAAAAT 43 8 0 

ATACACAATA TTTAACTATA ATAmATAATA TATCaTntTA ATTATAAATA CTAGATATTA 444 0 

TTTATAATAA TCTCAGGAAT TCGCTTCAAA ACTGCATCAT GAGAGTTTAT ATTTTTATTG 4 50 0 

AGAATCTCTC ATTTTATGAA TTGTAGGAAG TAAACAAAAT ATGACAAGCG TCAAACCAAT 4560 

GATAATGATA AAT AT CAT AT TAAACCATAG TAAATTGAAT TGATGATGGT GTTGTATTTG 462 0 

CCAAATTTCT AATACTGTGA AGATAGACAT ATAGCTCATA ATCT CTAAAT TTAACGTACT 468 0 
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AAATCGTTCA TAGTATCTAC CTGCAATGAA AAATATAAGC CAAATCACTA TAAATGCGCT 4 8 00 

ATTAATCAAA AGCAGCACCC ATTTATCAGC AAAATTATCA GCATCCCCTG CTAAATTATA 4 86 0 

ATGAATAGGC ACTTTGGTTG GTAATTTTGG ATAGGTCACT ACTGTATAGC ACATCATAGC 4 920 

TAAGTAAATA AGTAGACTTA ATATTGTAAA AGACCTGATT TTAGACATTC TATCGCCTcT 4 9 80 

TcTTTACATT TTATGTATAA CACTCTGCCT ATTTTACCTT TTAATaCATT ACCCCAAcGA 5 04 0 

TtAAaCAATA tGTAaTGATA CTATAATTGC GTCAGGAGTA TCCGCTTGTT AAATGTGCAT 5100 

AGCTTATATT TAGCTGTTTA ACATGCCACA TAATGATTCG AATTATT 514 7 
(2) INFORMATION FOR SEQ ID NO: 183: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1312 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 183: 

CACTTACTTC CACCATTATC ATAACTTTAA AATGGATATA nTTCATCAAA CATTATCTAA 60 

AGGCGTCGCA CCTACACCAA CACCATCCAA CAATTAACTT ACAACTCTGC GATTACTTCT 120 

TCAGCAGCAA CTTTCACnTG CGTAATACAA TCAGGTAGTC CAACCGCTTC AAAAGATGCA 180 

CCAGTTACTC TAAGTCGTGG ATATGTTTGT TTAATATGTG CTTGAATCTG TCTAATTTGT 24 0 

TGAATATGAC CGACATGGTA CTGTGGCATA CTTTTCGGCA AACGATTGAC AATTGTAAAT 300 

TCAGGATCAC CTTTAAATGT CATCATTTGA CTTAAATCTC TACGTACAAT CGATACTAAT 360 

TCATTATCTG TATGATCATC AACCACAGTA TCACCTGGTT TACCTACATA CGCACGAATC 4 20 

AAAATCTTAC CTTCCGGTGT AGTAAATGGC CATTTTTTCG ATGTCCAAGT ACATGCGGTA 4 80 

ATGTCTGTAT CACTCGTTCT CGCAATTACG AAGCCAGTAC CATCATGGGT ATTTTCAATG 540 

TCTTTTTCAT CAAATGCCAA TACAACAGTT GCAACAGTCG TACTATCCAT CGTTTTAAAG 600 

TAATCAAATG CTGGATCTTG TCCGAACCAA TTTAAAAACA CTTGATGTGG TGTCGTTACT 660 

AATACGCCAT CATACACTTC TTCTAGTTGA TCATTGTAAA CAATTTTATA TTGTTTTTGA 72 0 

GATGTAATTA TATCATCCAC TGACGTATTG TAGCGTATTG TCACACCTTT ATTTTTAACA 78 0 

TCTTGTTCTA ATGCTTCAAT AAATGAGCTT AAACCATGCT TAAATTGTTT GAATTGTCCT 84 0 

TTCGGTGCGC CAGGATATAA TTGTCTTTGT TTCAGACGCT TATTTTTCTC ATCCTTCATA 900 

CCTTTTATCA GACTTCCGAA TGCCTCTTCT TTTTCTTTAA AATTAGGAAA CGTACTCATC 960 
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TCAAGTACCT CATTACCTAA 


TCTTGCTCTG AAAAATGCAC 


CAACAGAAAT 


GTC AC CAT CC 






TGCATTTGAG TAGGTTTTTT 


TAATAAATCA AACCCTGCTC 


TTAATTTACC 


AAGTGGCGAT 






ATTAATTTTG TAGTAACAAA 


TGGTTTAATA TCTGTTGGAA 


TACCCATAAT 


TGAACCACCT 






GGAATCGGAT ATAATTTATT 


TTTCGCAAAA ATATATGATT 


GTCCAGTCGT 


ATTTGTAACA 


1260 


to 


ATATCTTGTT CTAATCCAAT 


ATCTTTCGCT AATTCTGTCA 


TAATCGTTTT 


TC 


1312 


(2) INFORMATION FOR SEQ ID NO: 184: 








15 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 6157 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 








20 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 184: 








TTTTACAATA AAAATATGAT 


ATACTACTTG TCGTATATAA 


GGAACGGAGG 


ACAATTTATG 






CATACATTTT TAATCGTATT 


ATTAATCATT GATTGTATTG 




TGTTGTACTA 




25 


CTCCAAGAAG GTAAAAGCAG 


TGGACTTTCA GGTGCCATCA 


GTGGTGGTGC 


TGAGCAGTTA 






TTCGGTAAAC AAAAACAACG 


TGGCGTCGAT TTATTCTTAA 


ATAGATTAAC 


AATTATTTTA 




30 


TCAATATTAT TTTTTGTACT 


TATGATTTGC ATAAGTTATC 


TTGGTATGTA 


AGGTCCGGCG 




ATGTAAATGT CGGGCTTTTT 


TATTTATAAT TAAGAATGTA 


ATAGTTTAAC 


AATAAGCTAT 






G TAAAATAT A TAGCCTAGTT 


AAGTATGCAA AGGGAGCGTT 


AGATTTATGC 


AGATAAAATT 








AGGAAGGTAA ACG TGCCGTG 


TTATTACTAC 


ATGGTTTTAC 




35 


ACCAAAACCT TTCTTTTTTG 




AGGCAATTCG TCTGATGTTC 


GTCAATTAGG TCGATTTTTA 


CAAAAGAAAG 


GTTATACATC 






ATATJ5CACCG CAATATGAAG 


GCCACGCGGC ACCACCAGAT 


G AAAT ACT GA 


AATCTAGTCC 






TTTCGTTTGG tttaaagatg 


CGTTAGATGG TTATGATTAT 


CTTGTTGAAC 


AAGGTTATGA 






TGAAATTGTT GTTGCTGGTC 


TATCATTAGG TGGGGATTTT 


GCTTTAAAAT 


TAAGCTTAAA 






TAGAGATGTA AAGGGTATTG 


TAACGATGTG TGCTCCTATG 


GGTGGCAAAA 


CTGAAGGTG C 




45 


CATTTATGAA GGCTTTTTAG 


AATATGCACG CAATTTTAAA 


AAGTATGAAG 


GTAAAGATCA 






AGAGACTATT GATAATGAAA 


TGGATCATTT TAAACCAACT 


GAAACTTTAA 


AAGAAC TAAG 


900 


50 


TGAAGCATTA GATACGATTA 


AAGAGCAAGT TGATGAAGTG 


TTGGATCCTA 


TTTTAGTGAT 


960 




TCAAGCAGAA AACGACAATA 


TGATTGATCC ACAATCCGCA AATTATATAT 


ATGACCATGT 


1020 




AGATTCTGAT GACAAAAATA 


TCAAGTGGTA CAGTGAATCT 


GGACATGTTA 


TTACGATTGA 


10BO 



55 
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AGAATAAAAA GAGATTTTAA CATTAGAAAG GAGGGGCATA ATGAATTTAA AGCAATCTAT 12 00 

AGAAGAGATT ATTAATCAAC CTGAATATGA ACCTATGTCA GTGT C AG ATT TTCAAGATGC 12 60 

ATTAGGTTTA AGCAGTGCCG ACTCGTTTAG AGATTTAATT AAGGTGCTTG TGGAGTTAGA 13 2 0 

ACAATCAGGA TTAATCGAAC GTACAAAAAC AGACAGATAC CAAAAAAAGC ATAGTTATAG 1380 

AGGTCAATCA AAATTGATAA AAGGAACGTT AAGTCAAAAT AAAAAAGGCT TTGCATTCTT 144 0 

AAGACCTGAA GATGAGGATA TGGAAGATAT ATTTATTCCC CCGACGAAAA TTAATCGTGC 1500 

CTTGGATGGA GATACTGTTA TTGTAGAAAT CCATCAATCA AAAGGTGAAC ATAAAGGTAA 1560 

AATCGAAGGG GAAGTTAAGT CGATTGAGAA GCATTCTGTA ACTCAAGTTG TTGGTACGTA 162 0 

TAGTGAAGCT AGACATTTTG GCTTTGTTAT TCCGGATGAT AAACGTATTA TGCAAGATAT 16 80 

TTTCATTCCT AAAGGTCAAA GTTTAGGCGC AGTCGATGGT CATAAGGTA C TTGTACAAAT 1740 

TACTAAGTAT GCTGATGGTT CAGATAATCC AGAAGGACAT ATTTCTGCTA TTTTAGGACA 18 00 

TAAAAATGAT CCTGGCGTAG ATATTTTAT C TATTATCTAT CAACATGGCA TAGAAATTGA I86 0 

ATTTCCTGAT GAAGTGTTAC AAGAAGCTGA AGCAGT AC CT GATCATATTG AAAATA CTGA 192 0 

AATTAAAGGC CGTCATGATT TACGTGATGA ATTGACAATC ACAATTGATG GTGCTGATGC 19 80 

TAAAGACTTA GATGAC GCAA TTAGTGTTAA AAAGTTAGCG AACGGTAATA CGCAATTAAC 2040 

TGTAAGTATT GCTGATGTCA GCTATTATGT AACAGAAGGT TCTGCATTGG ATAAAGAGGC 2100 

ATATGATAGA GCGACAAGTG TATATCTTGT TGACCGTGTA ATTCCAATGA TTCCACATCG 2160 

ATTAAGTAAT GGTATTTGTT CATTGAATCC TAATGTTGAT CGTTTAACTC TAAGCTGTCG 2 22 0 

CATGGAAATC GATGCTAGTG GTCGCGTTGT TAAACATGAA ATTTTTGATA GTGTTATACA 2 2 80 

TTCTGATTAT CGAATGACGT ATGATGCGGT AAATCAGATT ATTACTGAAA AGGATCCTAA 2 34 0 

CATTCGCGAA CAATATAATG AAATTACGCC TATGCTAGAT TTAGCACAAG ATTTATCTAA 24 00 

TCGTTTGATT CAAATGAGAA AACGACGTGG TGAAATCGAT TTTGATATTA GTGAAGCAAA 2460 

AGTATTAGTT AACGAAGACG GTATACCAAC AGATGTTCAA TTAAGACAAC GTGGCGAGGG 252 0 

TGAACGTCTA ATTGAATCAT TTATGTTAAT TGCAAATGAA ACAGTTGCTG AACATTTTAG 2 580 

TAAGTTAGAT GTAC CTTTTA TTTA CCGAGT GCATGAGCAA CCTAAATCAG ATCGCTTAAG 2 64 0 

ACAATTCTTT GATTTTATTA CAAACTTTGG CATCATGATT AAGGGTACTG GCGAAGATAT 2700 

TCATCCAACA ACACTTCAAA AGGTTCAAGA AGAAGTAGAA GGTCGACCTG AACAAATGGT 276 0 

CATTTCAACA ATGATGTTGC GTTCAATGCA ACAAGCGCAT TATGATGATG TGAACTTGGG 2 820 

ACATTTTGGC TTATCAGCTG AATATTATAC GCATTTTACA TCACCAATTA GACGTTATCC 2 880 
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AGAAGTGAAG CGTTGGGAAG ACAAATTGCC TGAGTTAGCT GAACATACTT CTAAACGTGA 3 000 

ACGTCGTGCT ATTGAGGCAG AACGTGATAC TGATGaATTG AAAAAAGCAG AATATATGAT 3060 

TCAACATATT GGTGATGAAT TTGAAGGTAT TGTCAGCTCA GTAGCTAACT TCGGTATGTT 3120 

CATTGAATTG CCAAATACGA TAGAAGGTAT GGTTCATATT GCGAATATGA CTGATGATTA 3180 

TTACCGTTTT GAAGAGCGTC AAATGGCATT AATTGGTGAG CGTCAAGCTA AAGTATTTAG 324 0 

AATTGGTGAC ACAGTTAAGG TTAAAGTGAC GCATGTTGAT GTAGATGAAC GATTAATTGA 3 300 

TTTTCAAATT GTAGGTATGC CTTTACCGAA AAATGATCGA TCACAGCGCC CAGCGCGAGG 33 SO 

TAAGACAATT CAAGCCAAAA CGCGTGGTAA ATCATTAGAT AAATCAAAAT CTGATGATAA 34 2 0 

GGGTCGTAAG AAAAAAGGTA AGCAACGTAA AGGTAAAAAC CAACGTAATA ATGATAAATC 34 80 

AGGTAATAGT AAGCATAAGC CATTTTATAA AGATAAAAGT GTGAAAAAGA AAGCACGTCG 3540 

TAAGAAAAAA TAAGCAGCAA TGAGGTGAGT ATGAATGGCT AAGAAGAAAT CACCAGGTAC 3600 

ATTAGCGGAA AATCGTAAGG CAAGACATGA TTATAATATT GAAGATACGA TTGAAGCGGG 3660 

AATTGTATTG CAAGGCACAG AAATAAAATC AATTCGCCGA GGTAGTGCTA ACCTTAAAGA 372 0 

TAGTTATGCG CAAGTTAAAA ACGGTGAAAT GTATTTGAAT AATATGCATA TAGCACCATA 378 0 

CGAAGAAGGG AATCGTTTTA ATCACGATCC TCTTCGTTCT CGAAAATTAT TATTGCACAA 3 84 0 

GCGTGAAATC ATTAAATTGG GTGATCAAAC ACGTGAGATT GGTTATTCGA TTGTGCCGTT 3 90 0 

AAAGCTTTAT TTGAAGCATG GACATTGTAA AGTATTACTT GGTGTt GCAC GAGGTAAGAA 3 960 

AAAATATGAT AAACGTCAAG CTTTGAAAGA AAAAGCAGTC AAACGAGATG TTGCGCGCGA 4 02 0 

TATGAAAGCC CGTTATTAAG CGATTTAGTT GCTTAATCGG GCTATATTTG ATATAGTTAT 4080 

ATGTGCTTTT GTAAATTACA AAAGTATGAT TTGTTTGATT TATTATTTCG GGGACGTTCA 414 0 

TGGAfTCGAC AGGGGTCCCC CGAGCTCATT AAGCGTGTCG GAGGGTTGTC TTCGTCATCA 4 200 

ACACACACAG TTTATAATAA CTGGCAAATC AAACAATAAT TTCGCAGTAG CTGCCTAATC 4260 

GCACT CTGCA TCGCCTAACA GCATTTC CTA TGTG CTGTTA ACGCGATTCA ACCTTAATAG 4 3 20 

GATATG CTAA ACACTG CCGT TTGAAGTCTG TTTAGAAGAA ACTTAATCAA ACTAGCATCA 4 380 

TGTTGGTTGT TTATCACTTT TCATGATGCG AAACCTATCG ATAAACTACA CACGTAGAAA 4440 

GATGTGTATC AGGACCTTTG GACGCGGGTT CAAATCCCGC CGTCTCCATA TTTGTAGCCT 4500 

ACAGCCTTTG TGGTTGTGGG CTTTTTTATT TTGTGTTTTT CAGGGGATAA TGCATTGCAG 4 560 

AATTTGTTGT GAGTATTGAT ATAGCAGTGT TTGTATAGGT GTTTATTTGA TGGAGGAAAG 4 620 

AGTAATAAGT GATTATGAAT TAGTTTTTGA GATATAAGGG GACAGTGATG TGTGTCAAAT 4 680 
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TTATACGCAA AAAATTCTCC ATGTTATATA TGTCAATATA AAAATGTGAA TCGTCTACAC 4 8 00 

TTAATTGGAT AAATGGCTAC TGAAAAAGAA CTTTT CATTT TTGTTACGTC ACTAAGTGGG 4 8 60 

5 TGTAGTTATA AAGAGATGAG CCGAGTTTTG ATATTTTCAT TAGAATCAAT ATGCCTATTA 4 920 

ACACAATCAG CAATAGTTGA CGAGACGGAA ATAAAAGAAG TCGTAGTTAA GAAATGCATT 4 9 80 

TCACAACATA CCATTGTAGC CATTTTTATT GTTTTGGATG ATAAACTCTT TTTGGAATTT 5040 

10 

TTAGTTTTTA TAATTTGCAA CTACACTACT TCTTTTACTA ATATTAATGT CTAAGTAATC 5100 

GATAAAAAAT TTTCCATTGA ATAAATGAGA AGTTAAAAAC TTTACTTAAC CTTTCycATT 5160 

J5 GCATTTTCCT ATTCACGATT TTAAGAACCC AACATACTAC AAACGAATTT TAAAAGGCGA 5220 

GAGTAAAGCT TACTTGTTTA TTATACATAT TTAAAATCCA AGAGTCAGAA CAGACTACTC 52 8 0 

CTCTTTATAA CTATAAAAAA TAGCTATGAA AAAATCTATC GTCATAGATT CCTTCATAGC 534 0 

20 TAATCTTAGT ATGTTTATTT TTATTTTAGG ATGCTATTTA TCAACTCAAC ATATAACTCA 54 0 0 

CTATTTTTAT AACCTTCTAA TATATCATTA ACTTGTCTAA TAGGTATTTC TGGTACTTCT 5460 

CTAATGTTTT CCAATTTTGT TTTAAATTGT TTTTTTGTTA TTTGCTCTTT ATTTGTAGCC 552 0 

25 AATTGGAACA AGTAAGAATC TAG CATATTA ATTTCTTTAT ATGAATACAT ATATCTTAAT 558 0 

AACACTAAAT CTCTAGTTTT TAAGTTAGGC GCTAGTTCTT CTTG T AATTG TTCTATTGAT 564 0 

TGTyTCATTA ATAACAATCT CATTT CTAAT TCTTCATTAT TCATTTTATC ACACTCTTtT 57 00 

30 

TATATTAATG CTTGACCAAC TTGGGAAACC CAAAACCCTA TGCTTCTTGC AGTAGAATCT 5760 

TTAATACCAG TTCCCATCAA TGCTTGTGAA ACTTGACCTT GTACATTTCC CCATGTAGCC 5820 

3S TCTTCTTGTT TTAATGCATT ATTCAATGCG GGATTTACAA ATTTATCCCA TCTTTTTTTT 58 80 

ATGATTTTCC GGCACGGGGA CTGATTTCTT TAACACCATT AAACACAGAT TTTTTATTTT 594 0 

TAATCATAGC TTTATAGTAT CATGTTGGCT AAGCTATAAA TAAGTCAGTT TCTCTAAAAA 6000 

40 TTAAATAACT GAATGTAAGA CAATCAACAA wCCAAATTTA TACTTCATCT AAACCACTGT 6060 

GGTCGTCATC TTTTTGCTTT TCTTTTTCTT TCTCTCGTTC TTGTTCTTTT TTGTACTCTT 6120 

CTTCAAATTC TTTTTCTTTC TTTTCTACTT CTTCTCT 6157 

45 

(2) INFORMATION FOR SEQ ID NO: 185: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 884 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

££ 
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CATTTGTTAT TCTGAGTAGC CAATTTGGCA AAGATGAACA AACGTCTGAA CAAACGTATC 60 

AAGTTGCAGT CGCATTAGAG TTAATTCATA TGGCAACACT TGTTCATGAT GACGTTATTG 120 

5 ATAAAAGCGA CAAGCGTCGA GGCAAGTTAA CCATATCAAA GAAATGGGAT CAGACAACTG 180 

CTATTTTAAC TGGGAATTTT TT ATTGG CAT TAGGACTTGA ACACTTAATG GCCGTTAAAG 240 

ATAATCGTGT ACATCAATTG ATATCTGAAT CTATCGTTGA TGTTTGTAGA GGGGAACTTT 3 00 

TCCAATTTCA AGACCAATTT AACAGTCAAC AGACAATTAT TAATTATTTA CGACGTATCA 3 60 

ATCG CAAAAC AGCACTGTTA ATTCAAATAT CAACTGAAGT TGGTG CAATT ACTTCTCAAT 42 0 

CTGATAAAGA GACTGTACGA AAATTGAAAA TGATTGGTCA TTATATAGGT ATGAGCTTCC 4 80 

15 

AAAT CATTGA TGATGTATTA GACTTCACAA GTACCGAAAA GAAATTAGGT AAGCCGGTCG 54 0 

GAAGTGATTT GCTTAATGGT CATATTACGT TACCGATtTT ATTAGAAATG CGTAAAAATC 600 

20 CAGACTTCAA ATTGAAAATC GAACAGTTAC GTCGTGATAG TGAACGCAAA GAATTTGAAG 66 0 

AATGTATCCA AATCATTAGA AAATCTGACA GCATCGATGA GGCTAAGGCA GTAAGTTCGA 72 0 

AGTATTTAAG TAAAGCyTTG AATTTGATTT CyGaGTTACC a GATGGAC aT CCGaGACCAC 78 0 

25 TACyTTTAAG TTTGACGAAA AAAATGGGTT CAAnAAACAC GTAGTATTTA TGnAAAAGTA 84 0 

TTGAAAG CGC TTTACCAACC TGTTAATATA TAATAGTAAT ATAC 884 



(2) INFORMATION FOR SEQ ID NO: 186: 

30 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH : 6876 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

35 

- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 186: 

40 AATTT CAT CT GCTCGTGCAA AATCTTTGTT TTTCCTTGCT TCATTACGCT CTTCGATTAA 60 

TTTTTCAACA TCTTCATCCA ATAATTCATC TGCATTTTTA GATTTTAACG GTACACCTAA 12 0 

AACATCGCTG AAAATTTGAT AAACTGCTTT AAATTTATCA ATTACTTCTG TTGATGTTGT 180 

45 GTTCTCTAGT ACATATTTAT TCGCAAGTkT TGCTAAATCA TACCAAGCTG T AATTG CATT 24 0 

AGCTGTATTA AAATCATCAT TCATAACTGT TTCAAAACGA TTTAAAATCG CAT CAATTTG 300 
ATCAATATAT GTCTGTTGAT TTTCAATATT AGTAGCAATT TGTGCGCGCT CTTCAATTAA 360 

50 

TTGATAACTA TTGCGAATAC GCTCTAG Tc C a CTACGTGCT GATTCTACCA ATTCTAGATT 420 
ATAGTTAATT GGGCTTCTAT AATGTACGCT AATCATAAAG AATCTTAGTA CATCTGGATC 4 80 

55 
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ATTATCAATA TTAATGAAAC CATTATGCAT CCAATAATTA GCAAATGGCG CATGATTATG 6 00 

TGCTTCTGAT TGTGCTATTT CATTTTCATG ATGTGGAAAT TGTAAATCTG AACCACCCGC 6 60 

AT GTATAT CA ATTGTAGGTC CTAGCTCATG AAATGCCATT ACAGAACATT CTATATGCCA 7 20 

TCCTGGTCTA CCTTCACCAA ATGGGCTATC CCAACTAATC TCGCCAGGTt CGCTTTTTTC 7 80 

CACAATGTAA AATCAAGTGC ATCTTCTTTA TGCTCTCCTG CATCTATACG AGCACCCACT 840 

TTTAAGTCAT CTATGGATTG ATGACTTAAT TTAC CATAAC CTTCAAATTT ACGTGTTCTA 900 

AAGTAAACAT CGCCACCACT TTCATATGCA TAACCTTGAT CCACCAAATC TTTAATAAAT 960 

TGAATAATGT CATCCATATG GTCCATTACC CTTGGATTTG AAGTCGCTTT TCTAACATTT 1020 

AACGCACCAA CATCTTCATG AAAAGCAGCG ATATATTTTT CTGCAATTTC GGGAACAGAC 108 0 

TGATTTAATT CTTGAGAACG TTTAATTAAT TTATCATCTA CGTCTGTAAA ATTTGATACA 114 0 

TATTCTACAT TATATCCTTG GTATTCAAAG TAACGTCTCA CTACGTCATA ATTAATTGCw 12 00 

GGTCTTGCGT TACCAATATG AATGTAGTTA TATACAGTAG GACCACATAC ATACATTTTT 12 60 

ACTTTCCCTG GTTCTATAGG CTTGAACACT TCTTTTTGAC GTGTAAGCGT ATTATATAAT 13 2 0 

GTAATCATCT TGAATCTCTC CATTCCTAGT CTTTTCAAGT TGTCGTTCTA AATGCTTAAT 13 80 

TTGTTCATAA ATTGGATCAG GTAGATGGCG ATGATCAAAT GTTTTTCCAA CTCGAACACC 144 0 

ATCTTGCTTA ACAATATGTC CTGGTATACC AACAACCGTT GAATAACTTG GAACTGATTG 1500 

TAAAACAACT GAATTTGCAC CAATATTTAC ATTTGAATTT ATTTTAATAT TTCCTAAAAC 156 0 

TTTCGCACCG GCTGCTATTA AAACATTGTC TCCTATATCT GGGTGTCTTT TCCCTCTTTC 1620 

TTTCCCTGTC CCACCAAGTG TCACGCCTTG ATAGATTGTC ACATTATCAC CAATTGTACA 16 80 

TGTTTCTCCT ATTACAACGC CCATACCATG ATCTATAAAT AGACGCTTTC CAATTTTAGC 174 0 

ACCTGGATGG ATTT CTATAC CTGTGAAAAA TCTTGAAATT TGAGATATCG CGCGTGCTGC 1800 

AACATATTTT TTTTGGTTGT ATAACTTATG TGCAATCAAA TGACTCCAAA CTGCATGTAA 18 60 

ACCTGCATAC GTTGTAATGA CTTCTAATGT TGAACGTGCC GCTGGATCCT GCTCAAATAC 1920 

CATTTTTATA TCGTCTCTCA TTCTTTTTAA CAAGATCATT TCCTCCTCAA TGATTGAACT 1980 

ACGTAAATAC ATAATTGAAG TACCTGCGAA ATTAAATATC AAAAAAGCAC CACTAACATA 2040 

CAAATTGTAT TGTTAGAGGC GCTTCCGCAC GGTTCCACTC TGAATTTAGC GAATAACATT 2100 

AATAATATTG CGGGCGCTTC CAAATTATCA AGGAAACTAA GTCAACTTAA TGCTCATCAC 2160 

TCTCATTATA TATTTAATTC ATTTTACGAA GGTGCATTCA TTAATTTCTA CGTTGTACTC 2220 

ACAGCAACCG TACACTCTCT GCATCGTATA AATTTAATTA CTAATCCTTC GTTTTATATA 2280 
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ATAAAATTCA 


AGTATATACT 


ACCTTGATCT 


TGTCTATTTC ATTACTTATA 


TTGTTTTAAA 




CGGTTTAGCA 


CTTTTTCTTT 


ACCAAGTACT 


TCAATTGTAT 


TTGGTAATTC 


AGGACCATGC 




ATTTGGCCTG 


TTACAGCAAC 


ACGAATAGGC 


ATAAATAATT 


GCTTGCCTTT 


TATTCCTGTT 




TCTTTTTGAA 


CTTCTTTAAT 


TGTCTTTTTA 


ATTTCAGCCG 


CTT CAAATGG 


TTCAAGTGCT 


w 


TCTAATTTAC 


TGAATAAGTG 


CGTCATTAAC 


TCTGGTACTT 


GCTCTCCATT 


AATCACTTGT 




TGTTCTTCTT 


CAC CAAGAGC 


TGGCATTTCT 


TTAAAGAACA 


TTTCTGATAA 


AGGTACAATT 




TCACCGGCAT 


AACTCATTTC 


TTTTTGATAA 


AGCGCAATTA 


ATTTGCGTCC 


CCAAGATAAA 


15 


TCCTCTTCTG 


ACGGCACCTC 


AGGAATCAAA 


TTTGCTTTAA 


TTAAATGAGG 


TAATGCTAAT 




TGGAATACTG 


TTTCAGTATC 


TTTTTGTTTC 


ATATATTGGT 


TATTAACCCA 


TGCTAATTTT 




TGCTTATCGA 


AAAATGCTGG 


TGATTTTGAC 


AAACGCTTTT 


CATCAAAGAT 


TTTGATAAAT 


20 


TCTTCTTTAG 


AAAAGATTTC 


TTCTTCACCT 


TCAGGAGACC 


AACCTAATAA 


CGCAATAAAA 




TTAAATAACG 


CTTCAGGTAA 


ATAACCTAAG 


TCACGATATT 


GCTCAATAAA 


TTGTAAAATT 




TGCCCATCAC 


GTTTACTTAA 


CTTTTTACGT 


TCTTCATTAA 


CAATTAATGA 


CATATGACCA 




AAACGAGGTG 


GCTCCCAGCC 


AAATGCTTCA 


TAAATCATAA 


TTTGTTTAGG 


CGTGTTTGAA 




ATATGATCAT 


CACCACGAAT 


TACATCTGAA 


ATTTGCATGT 


AATGATCATC 


TATAGCTACT 


30 


GCAAAATTGT 


ACGTTGGAAT 


GCCATCTTTT 


TTTACGATAA 


CCCAGTCACC 


AATACCATTT 




GAATCAAATG 


AAATATTTCC 


TTTTACCATA 


TCATCAAATG 


AATACGTTTG 


GTTTTGAGGT 




ACTCGGAAAC 


GAATTGATGG 


TTGGCGTCCT 


TCTGCTTCAA 


ATTGTTGACG 


TTGTTCTTCA 


35 


GTCAAATGCG 


CATGTTGACC 


ACCATAGCGA 


GGCATTTCAC 


CACGAGCGAT 


TTGCGCTTCA 




CGTTCAGCTT 


CTAATTCTTC 


TTCTGTCATA 


TAGCATTTAT 


ATGCTTTATC 


TTCTGCTAGT 




AACTCATCTA 


TTAATGGTTG 


GTAGATATGT 


TGACGTTCAG 


ATTGACGATA 


TGGTCCGTAG 


40 


CCATTGTCTT 


TATCTACAGA 


CTCATCCCAA 


TCTAATCCTA 


A C CATTTAA G 


ATTATCAAAT 




TGTGATGTTT 


CTCCATCTTC 


TAAATTACGT 


TTTTTATCAG 


TATCTTCAAT 


TCGAATCACA 




AAATCTCCGT 


TGTAATGTTT 


AG CATACAAG 


TAATTGAATA 


ATGCTGTTCT 


TGCATTACCA 




ATATGAAGAT 


ACCCAGTTGG 


ACTTGGTGCA 


TATCTTACTC 


TTATACGATC 


GCTCATTTTT 




TTCACTCCTA 


AATTAAATAT 


CAGATTTTCA 


AGTTAGTTCA 


TATAAATTGT 


TCATTTGCTA 


50 


TCTTCGACCG 


TCATAACAAA 


TGTCTAACTC 


GTCTTATTGT 


TAAAACGAAA 


CAATGCTTTT 




TAACATGACC 


TTAAAATAAT 


TTCATTGTTT 


AATCATAACA 


TAATTCCCTG 


GGTAATATGC 




TTAAATTTTA 


AATAGAAAGC 


TGTTGTTTTT 


TCAACACTTT 


AAAAAAGCTA 


TCCCTAAGAA 



2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
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TTAAACTTCA AATTAACTAT TCAAATACGT TAAAATTGAT TCTAATTTTG TATGTCTTGA 4 2 00 

TTGCTATAAG AATAACTTTA TTAATATCTA AAATTTAACA CTTAATGAAC TTGTTTCAAT 42 60 

5 

GATATATTAG CACTATTTGT ATTTTTTGAT AACTAATATG TTTTG C ATTT ATTTATAGTT 4 3 20 

ATACTTCAAA TTACAAACTt CGCCATTTCA TATACCTTTT AATATCTATT TTGTTTTCGT 4 3 80 

CAACTACAGT TTTTATAATG ATACTGTATC TTCGATTTTT TTAGCAAAAA CAATTCTTCC 4440 

10 

TGAAGATGTT TGCAATAAGC TGACTACTTC TAAATTGACA TGACTGCCAA TAAGATTTTT 4 5 00 

AGCATTATCA ACAACTACCA TCGTACCATC ATCTAGATAT CCTACTGCCT GACCAGGCtC 4 5 60 

)S CTTACCCATT TTTGTCAGTA AAATATGCAG TTGATCACCT TGATGTACAT TAGGTTTGAT 4 620 

TGCTTCTGAT AAATCATTAA CATTTAATGC TTTGATACCA TGTACATGAC AAACTTTATT 4 6 80 

TAGGTTGAAA TCTGTCGTTA TAATACTTGC ATGATATTGT TTTGCTAATT TTAATAACAT 4 74 0 

20 CGTATCAATA TCACTATGTG TTTTAGTTGG ATGTATAACC TTTGTAGGAT AGTCTAAATC 4 8 00 

ATACAATTCA TTTAAAATAT CTAAGCCTCT TTTACCCTTT TCaCGTTTAA CACTGTCATT 4 8 60 

TGAATCTGCA ACAATTTGTA ATTCATTAAT AACACCTTGT GGAATTAAAA TATTGCCATC 4 920 

25 GATAAAACCG CAACGAATGA CTTCTAAAAT ACGACCATCA ATAATTGCGC TTGTGTCGAT 4 980 

AATTTTTGGC GTAgcaCTTT TaGTATGTTG TGACATGGAA CGCGCTATAT TCTCAGGTAA 504 0 

AAACATTAAC ATTTCATCTC GTTTTTTAAG GCCAAATTGG AAACCGAAAT AACATAGTAA 5100 

30 

TATCGTAATT ATGACAGGAA TGAAATGATT AAAAATAGAG TTGCCAATTG ATTCTAATAT 5160 

AAACGACACC ATAACAGAAA TAAGTAATCC GATTATTAAA CCTATTGTTG CGAATAGTAT 522 0 

3S TTCAACAGCA CTTCTACGCA TAATAAAATG TTCTAAACCT TTTATAGCGT TAGTAACTCG 52 8 0 

TCTAATAAAT ACACCAAAAA TTAAGAACAT AAAAATACTA CCGATAATGC CATCTACATA 534 0 

GTGATTTTTT AAAAAGCTGG AGTTTTGTAA TCCAAGATCA TTTGCAATTT CAGGAATAAT 54 00 

40 AATTATT CCT AATGCGCTCC CAATAATTAA GTAAATAATA ATAACCATTA GTTTAACGAT 54 6 0 

ATTCACACAA TGTCCTCCTT TCTTGATGTT TTATGAATGA AGAGCAAATG ACAATACTTC 5520 

ATGTACAGTA GTTACACCTA TTACTTGTAT ACCTTCAGGA TATGTCCATC CGCCTATATT 5580 

45 ATTTTTAGGA ATAATTACAC GTTTGAAACC TAGTTTTGCA GCCTCTTGCA CGCGTTGTTC 564 0 

TATCCGAGAT ACACGACGTA CCTCACCCGT TAAACCAACT TCTCCAATAT AGCAATCTAA 5700 

TCCGTCGACA GCTTTATCTT TAAAGCTAGA TGCAGTTGCT ACAATTACAC TTAAATCAAC 5760 

so 

TGCTGGCTCC GTTAACTTTA CACCGCCAGC TACTTTGATA TAAGCATCTT GTTGTTGTAA 5820 

TAGATAATTT TCTTTCTTTT CCAAAACAGC CATCAACAAA CTTAATCGAT TATGATCAAT 5880 

55 
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TATTAAAAGT GGTCTGGTTC CCTCCATGGT TGCAACAATT GTTGAACCTG GAACATTTGT 60 0 0 

TGAACGTTCT TCTAAAAACA TTTCAGATGG ATTATTTACA CCTTTTAATC CACTTTGCTT 606 0 

s 

CATTTCGAAG ATTCcCATTT CATTCGTTGA ACCAAAACGG TTTTTAACAG CTCGCAAAAT 6120 

TCGATATGCG TGGTG TTCAT CGC CTTCAAA ATAAAGCACA GTATCaACCA TGTGTTCTAG 6180 

CAATCTTGGG cCCAGCAATT TGACCTTCTT TCGTTACATG ACCCACTATA AAAGTTGCaA 624 0 

W 

TGTTCATTTG TTTAGCAATA TTCATTAAAC TTTGTGTACT TTCACGAACT TGTGAAACAG 63 0 0 

AACCTGGCGC AGAGCTGATT TCAGGATGAT ATATTGTTTG AATCGAATCC ACTACTAATA 6360 

)S AATCAGGTTG TTCTTCTTTT ACTGTTTGAT AAATAACTTC AAGATCTGTT TCAGCTAATA 64 2 0 

CTTGCAATTC ACTTGAATCT TCATCTAATC GCTCTGCACG TAATTTAGTC TGACTAAGCG 64 80 

ATTCTTCTCC AGTAATATAT AGTACTTTTT TCTTTTGAGA TAACGATGCA CAAATTTGTA 6 54 0 

20 AAAGTAACGT TGACTTACCA ATACCTGGAT CCCCACCAAT AAGTACTAAC GATCCGCTCA 6600 

CAATACCTCC ACCTAATACA CGGTTGAATT CTGCTGAATC TGTTAACACT CTCGGCGTTG 6660 

TTTCATGTTT AATACTATTT AATTTTTGTA CTTTACCTGC TAATTCCTTG GTTTTAACTC 6720 

25 

CATGTTTAGG ATTGGCTGCT TTTTCAACAA TTTCCTCCAT TTGATTC CAA GCGCCACAAT 6 78 0 

TAGGACATTT CCCCATCCAT TTAGGAGATT GATAACCACA AGC CATACAT TCAAAAATCA 6 84 0 

CTTTTTTCTT GGCCArAATT GCAcCTCCAC TTTCTT 6876 

30 

(2) INFORMATION FOR SEQ ID NO: 187: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1193 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 ' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 187: 

CAACTCAAAC AGCAGAACAA CGTCGTGAGT TGATTAATGG TGTATTTACT GACATTAATC 60 

CCATACATTA AAAATATGAT GTACGTGTTA GCAGATAATA GACATATCTC ATTAATAGCT 120 

45 GACGTATTCA AGGCGTTCCA AAGCTTATAT AACGGACACT ACAATCAAGA TTTTGCAACA 180 

ATTGAGTCAA CATATGAATT GAGTCAAGAA GAGTTAGATA AGATTGTCAA ACTAGTAACT 24 0 

CAACAAACGA AGTTATCTAA AG TTATTGTA GATACAAAAA TTAATCCAGA TTTAATTGGT 3 00 

50 

GGATTTAGAG TTAAAGTCGG CACAA CTGTA TTAGATGGTA GTGTTAGAAA TGATCTTGTC 3 60 

CAATTACAAA GAAAATTTAG AAGAGTTAAT TAATTATAAA GAGGAGTGAC ATAGATGGCC 420 

£5 
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ATGTCCGTAA 


CTGATGTAGG 


TACTGTATTA 


CAAATTGGTG 


ATGGTATTGC 


ATTAATTCAC 


540 


GGATTAAATG 


ACGTTATGGC 


TGGTGAGCTA 


GTAGAATTCC 


ATAACGGCGT 


ACTTGGTTTA 


SOO 


GCCCAAAACC 


TTGAAGAGTC 


AAACGTGGGT 


GTGGTTATTT 


TAGGACCATA 


CACAGGTATT 


660 


ACTGAAGGTG 


ACGAAGTTAA 


ACGTACTGGT 


CGTATCATGG 


AAGTACCAGT 


AGGTGAAGAA 


720 


CTAATCGGAA 


GAGTTGTTAA 


TCCATTAGGA 


CAACCTATTG 


ATGGAcAAGG 


ACCGATTAAC 


780 


ACAACTAAAA 


CACGTCCaGT 


AGAGAAAAAA 


GCTACTGGTG 


TAATGGATCg 


TAAATCAGTA 


840 


GATGAGCCAT 


TACAAACAGG 


TATCaAAGCA 


ATTGATGCTT 


TAGTACCAAT 


TGGTAGAGGT 


900 


CAACGTGAGT 


TAATCATCGG 


TGACCGTCAA 


ACAGGTAAAA 


CAACAATTGC 


AATTGACACA 


960 


ATTTTGAACC 


AAAAAGATCA 


AGGTACGATT 


TGTATCTATG 


TTGCTATTGG 


TCAAAAAGAT 


1020 


TCAACAGTAA 


GAGCAAATGT 


TGAAAAGTTA 


AGACAAGCAG 


GCGCTTTAGA 


CTACACTATT 


1080 


GTTGTAGCAG 


CATCAGCTTC 


TGAACCTTCT 


CCATTATTAT 


ATATTGCACC 


ATATTCAGGT 


1140 


GTAACAATGG 


GTGAAGAATT 


CATGTTTAAC 


GGTAAACATG 


TTTTAATCGT 


TTA 


1193 



(2) INFORMATION FOR SEQ ID NO: 18 8: 

25 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 5549 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 188: 



TGCTAAGAAG 


TCAAAATAAA 


CTAACTATnA 


AACATCTAGT 


ACGATTATTA 


AAGTGACAGA 


60 


TnATAAAATT 


GAATTATTnA 


GAGAAGGAGA 


TATAAAGTTT 


GAAGAAATAA 


AAGAAAGACT 


120 


AGGTACAGGT 


ATTATTTATG 


AATAAGTTAA 


TACTTGGGAT 


TTATTTATAC 


CGAATTTTTT 


180 


CACGAGCATA 


CTTTTATTTA 


CCGTTTTTAT 


TAATTTACTT 


TTTGATTCAA 


GGTTATTCCA 


240 


TAATACAATT 


AGAAATATTA 


ATGGCGTCTT 


ATGGCATTGC 


AGCATTTTTA 


TTCTCTCTAT 


300 


ACAAAGAGAA 


GTGTTTTAAA 


ATTTGTAACT 


TAAAAGATTC 


TAATAAATTA 


GTTGTTAGTG 


360 


AAATATTCAA 


AATCATCGGT 


TTATTGTTGT 


TATTATATCA 


AAATCAATAT 


TTAATTT TAG 


420 


TAGTGG CACA 


AATATTATTA 


GGGTTAAGTT 


ACTCAATGAT 


GGCGGGTGTT 


GATACCG CAA 


480 


TAATTAAAAG 


AAATATAACA 


AATGAGAAAT 


ACG TACAAAA 


TAAGTCAAAT 


AGCTATATGT 


540 


TCCTATCATT 


ATTAATTTCA 


GGGATTATAG 


GTAGTTATCT 


TTATGGAATA 


AATATTAAAT 


600 


GGCCTATAAT 


AATGACTGGT 


ATATTTTCAA 


TTCTAACAAT 


TATAATTATT 


CGATGCACAT 


660 
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TACCAGAAGA GAAGTTTTGG ATATTGCATT ATTCTTTTTT AAGAGCGTTA ATATTAGGAT 780 

TTTTTATAGG ATTTATTCCA ATTAATATAT ATAATGATTT AAAACTGAAT AATTTACAAT 84 0 

TTATTTCAGT ATTAACTTGT TACACAGTTA TGGGTTTTGT ATCTTCACGT TATTTAACTA 90 0 

AATACTTGAA TTATAAGTTT GTGTCAGAAA TTTGTTTAGT AATATTTTTA ATAATATATA 96 0 

CATATCAAAG TTTCATAGCA GTTACTATTT CTATGATATT TTTAGGTATT TCTTCAGGGT 102 0 

TAACTCGTCC ACAAACTATA AATAAACTTT CTAGCAGTAG TAACTTAAGA GTGATGCTTA 1080 

ATTATG CAGA AACGTTATAT TTTATTTTTA ATATCGCATT TTTACTTATG GGTGGTTACT 114 0 

TATATACAAT AGGAACTATT CAATACTTAA TATTATTTAT TTCGTTATTA ATTTTTATAT 1200 

ATTTAATAAT AATATTTyAT TTTACAAGGA GAG AG CAACA TGAAAATAAA AACTGAATTT 1260 

AAAGGGAACA ATATACCATA TGAATACGCA GCAGGTGCAG ATGTGAGTGA TTCTATTAAC 1320 

GGGAATCCAA TTAAGTCATT TCCATTTGAA GTAATTGAAT TACCGGAAGG gACTAAATAT 138 0 

CTTGCTTGGT CTTTAATTGA CTATGATGCA ATTCCTGTAT GTGGCTTTGC TTGGATTCAT 144 0 

TGGAGTGTAG CTAATGTAAG TGTTAGTGGC AATTCAATTT CTATAAAAGC AGATTTATCA 150 0 

AGAACAAAGG GCGACTATGT ACAAGGTAAA AATAGCTTTA CTAGTGGGTT GTTGGCTGAA 15 6 0 

GATTTTTCAG AAATAGAAAA TCACTATGTA GGACCTACAC CACCTGATCA AGATCATCAA 162 0 

TATGAATTAA CAGTTTATGC GTTAGATCAT TCTTTAAATT TGAAGAATGG GTTCTACTTG 16 80 

AATGAATTTT TAAAAGAAGT AAATCAACAT AAAATTG AT C AAACAAGTAT TAACCTTATA 1740 

GGAAGAAAAA TTTAATACTA AATATCTCAT CAATATAAAA TTGTTCAATT AAAAGTACAA 180 0 

AGAAACAAAG GTTTTAATTT ATATATTAGG TACGGCGTTC GCTATAATGC AAAGAAGTAA 1860 

TTAAATTTAA GAAATGTAAA CTTAGTTATT GTAATGTGAA TTTATTTGAA AAAATAGAAA 1920 

GTATTAACAA TTATAGCTTT TACATTAATT AAAATTTATT TTTAAAAACA AGTAAACAAT 1980 

TTACATACTT ATAATTTTTG AAAATTTTCA ATTTGTGTTA TATTGATTTT GTAAGATACT 2040 

TTAACTCACA AAGGAGAGAG AGTATATGAA ATTAAAATCA TTTATAACTG TAACTTTGGC 2100 

ACTGGGCATG ATCGCAACGA CTGGCGCTAC TGTGGCAGGT AATGAGGTAT CTGCAG CAGA 2160 

AAAGGACAAA CTACCGG CAA CTCAAAAAGC TAAAGAAATG CAAAATGTTC CATATACAAT 2220 

TGCAGTAGAT GGCATTATGG CTTTCAATCA ATCTTACTTA AATTTACCAA AAGATAGCCA 2280 

ATTATCATAT TTAGATTTAG GAAATAAAGT TAAAGCTTTG TTATATGATG AACGCGGTGT 2340 

AACACCTGAG AAGATTCGAA ATGCAAAATC TGCCGTTTAC ACGATTACTT GGAAAGATGG 24 00 

TAGTAAAAAA GAAGTGGATC TTAAGAAAGA TAGCTACACA GCAAACTTGT TTGATTCAAA 2460 
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CAACATGAAG CATTTAATTT TACAGTGATG ATTATAAAAT AATTGC CTTG ATACAAAGAT 2 580 

TACTCGTAAA TGACATCTTT GTATTAAGGC TTTTTCTAAA TTTAAAAGTG ATGGGTTAGA 2640 

5 GGTCATTGAG CTTTAAAATA TTCAAAATAC AAAACATTAA TGGCCAAAAA TAAAAGCCGC 2 7 00 

CTTTATCTGG GCAGCTTCAA TAATAAGAAA GACATATTTC ATTTTATACT AAATAGTTAT 27 6 0 

TGTGATGAAT CTTTCGGCGG TTTAATTACT GCAGCAAAAA TTGCTGTGAA AATCGTGAAC 2 820 

w 

AATACTGCCA TGATAATTGG ATTCACTACA TTTAAGCTGT CTCCACCTAC TAGGCTATTA 28 80 

AGTACAAAGT TAA CCATTTG CATTAATAAT AATGCCCAAA AGAATGTTAC GAGGTGTTTC 2 94 0 

1S ATGTCATTCT ACCTCCACTT TAATTATATA TATTTTATTT TAAGTGAAAG TTAGAAATTT 3 0 00 

GTATAGTAAC ATC TCATATA TTTTGACCAT ATTATACAGT TTAAATAAAT GATTTTATCT 3 060 

GAATGGCTAT TCTAAATTAA GCGCATTAAA ACCAATTTCA TACTGAAATT TGACGATAAT 3120 

20 AAAGCATTAA AATTTTATTA ACTAGTCAAT ATTCCTACCT CTGACTTGAG TTTAAAAAGT 3180 

AATCTATGTT AAATTAATAC CTGGTATTAA AAATTTTATT AAGAAGGTGT TCAACTATGA 324 0 

ACGTGGGTAT TAAAGGTTTT GGTGCATATG CGCCAGAAAA GATTATTGAC AATGCCTATT 33 00 

25 TTGAGCAATT TTTAGATACA TCTGATGAAT GGATTTCTAA GATGACTGGA ATTAAAGAAA 3 3 60 

GACATTGGGC AGATGATGAT CAAGATACTT CAGATTTAGC ATATGAAGCA AGTTTAAAAG 342 0 

CAATCGCTGA CGCTGGTATT CAGCCCGAAG ATATAGATAT GATAATTGTT GCCACAGCAa 34 80 

30 

CTGGaGATAT GCCATTTCCA ACTGTCGCAA ATATGTTGCA AGAACGTTTA GGGACGGGCA 354 0 

AAGTTGCCTC TATGGATCAA CTTGCAGCAT GTTCTGGATT TATGTATTCA ATGATTACAG 36 0 0 

3s CTAAACAATA TGTTCAATCT GGAGATTATC ATAACATTTT AGTTGTCGGT GCAGATAAAT 3 66 0 

TATCTAAAAT AACAGATTTA ACTGACCGTT CTACTGCAGT TCTATTTGGA GATGGTGCAG 372 0 

GTGCGGTTAT CAT CGGTGAA GTTTCAGATG GCAGAGGTAT TATAAGTTAT GAAATGGGTT 37 8 0 

40 CTGATGGCAC AGGTGGTAAA CATTTATATT TAGATAAAGA TACTGGTAAA CTGAAAATGA 3 84 0 

ATGGTCGAGA AGTATTTAAA TTTGCTGTTA GAATTATGGG TGATGCATCA ACACGTGTAG 3 900 

TTGAAAAAGC GAATTTAACA TCAGATGATA TAGATTTATT TATTCCTCAT CAAGCTAATA 3 960 

45 TTAGAATTAT GGAATCAGCT AGAGAACGCT TAGGTATTTC AAAAGACAAA ATGAGTGTTT 4020 

CTGTAAATAA ATATGGAAAT ACTTCAGCTG CGTCAATACC TTTAAGTATC GATCAAGAAT 4080 

TAAAAAATGG TAAAATCAAA GATGATGATA CAATTGTTCT TGTCGGATTC GGTGGCGGCC 414 0 

50 

TAACTTGGGG CGCAATGACA ATAAAATGGG GAAAATAGGA GGATAACGAA TGAGTCAAAA 4 2 00 

TAAAAGAGTA GTTATTACAG GTATGGGAGC CCTTTCTCCA ATCGGTAATG ATGTCAAAAC 42 6 0 

55 
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TGAACCTTAT AGCGTTCACT TAG CAGGAGA ACTTAAAAAC TTTAATATTG AAGATCATAT 4 3 80 

CGACAAAAAA GAAGCGCGTC GTATGGATAG ATTTACTCAA TATGCAATTG TAGCAGCTAG 44 4 0 

AGAGGCTGTT AAAGATGCGC AATTAGATAT CAATGAAAAT ACTGCAGATC GAATCGGTGT 4 50 0 

ATGGATTGGT TCTGGTATCG GTGG TATGGA AACATTTGAA ATTGCACATA AACAATTAAT 45 6 0 

GGATAAAGGC CCAAGACGTG TGAGTCCATT TTTCGTACCA ATGTTAATTC CTGATATGGC 462 0 

AACTGGGCAA GTATCAATTG ACTTAGGTGC AAAAGGACCA AATGGTGCAA CAGTTACAGC 46 8 0 

ATGTGCAACA GGTACAAATT CAATCGGAGA AGCATTTAAA ATTGTGCAAC GCGGTGATGC 474 0 

AGATGCAATG ATTACTGGTG GTACAGAAGC ACCAATTACT CAT ATGG CAA TTGCTGGTTT 4 800 

CAGTGCAAGT CGAGCGCTTT CTA CAAATGA TGACATTGAA ACAG CATGTC GTCCATTCCA 48 60 

AGAAGGTAGA GATGGTTTTG TTATGGGTGA AGGTGCTGGT ATTTTAGTAA TTGAATCTTT 4 92 0 

AGAATCAGCA CAAGCTCGAG GTGCCAATAT TTATGCTGAG ATAGTTGGCT ATGGTACTAC 498 0 

AGGTGATGCT TATCATATTA CAGCGCCAGC TCCAGAAGGT GAAGGTGGTT CTAGAGCAAT 504 0 

GCAAGCAGCT ATGGATGATG CTGGTATTGA ACCTAAAGAT GTACAATACT TAAATGCCCA 5100 

TGGTACAAGT ACTCCTGTTG GTGACTTAAA TGAAGTTAAA GCTATTAAAA ATACATTTGG 5160 

TGAAGCAGCT AAACACTTAA AAGTTAGCTC AACAAAATCA ATGACTGGTC AC TTACTTGG 522 0 

TGCAACAGGT GGAATTGAAG CAATCTTCTC AGCGCTTTCA ATTAAAGACT CTAAAGTCGC 5280 

ACCGACAATT CATGCGGTAA CACCAGATCC AGAATGTGAT TTGGATATTG TT C CAAATGA 5340 

AGCGCAAGAC CTTGATATTA CTTATGCAAT GAGTAATAGC TTAGGATTCG GTGGACATAA 54 00 

CGCAGTATTA GTATTCAAGA AATTTGAAGC ATAACTATAA nAATCTTCAG TAACGTTGTT 546 0 

TTAGTTACTG AAGATTTTTT CaGTTTCTTT ATACTAAGAT GAGCGACACA CAATCGTCAT 5520 

AATAAAATAT GAATATTTAT TAATAATAA 554 9 
(2) INFORMATION FOR SEQ ID NO: 189: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4832 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 189: 
AGATTATAGT AAGATTGATA GTTTGGCGAC TGaAGCgCGa GaAAAATTAT CAGaAGTAAA 
mCCTTTAAAT ATTGCACAAG CTTCTAGAAT ATCAGGGGTA AATCCAGCAG ACATATCTAT 
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TGGTTAGCAG AACAATTAAA AGAACATAAT ATTCAATTAA CTGAGACTCA AAAACAACAG 24 0 

TTTC AAA CAT ATTATCGTTT ACTTGTTGAA TGGAATGAAA AGATGAATTT GACAAGTATT 300 

ACAGATGAAC ACGATGTATA TTTGAAACAT TTTTATGATT CCATTGCACC TAGTTTTTAT 3 60 

TTTGATTTTA ATCAGCCTAT AAGTATATGT GATGTAGGCG CTGGAGCTGG TTTTCCAAGT 42 0 

ATTCCGTTAA AAATAATGTT TCCGCAGTTA AAAGTGACGA TTGTTGATT C ATTAAATAAG 4 80 

CGTATTCAAT TTTTAAACCA TTTAGCGTCA GAATTACAAT TACAGGATGT CAGCTTTATA 54 0 

CACGATAGAG CAGAAACATT TGGTAAGGGT GTCTACAGGG AGTCTTATGA TGTTGTTACT 600 

GCAAGAGCAg TAGCTAGATT ATCCGTGTTA AGTGAATTGT GTTTACCGCT AGTTAAAAAA 66 0 

GGTGGACAGT TTGTTGCATT AAAATCTTCA AAAGGTGAAG AAGAATTAGA AGAAGCAAAA 72 0 

TTTGCAATTA GTGTGTTAGG TGGTAATGTT ACAGAAACAC ATACCTTTGA ATTGCCAGAA 78 0 

GATGCTGGAG AGCGCCAGAT GTTCATTATT GATAAAAAAA GACAGACGCC GAAAAAGTAT 84 0 

CCAAGAAAAC CAGGGACGCC TAATAAGACT CCTTTACTTG AAAAATAATG CATAATCCTT 900 

TACAACTAAC ATAAAAGGAG CGAATGGATA ATGAAAAAAC CTTTTTCAAA ATTATTTGGT 960 

TTGAAAAACA AAGATGACAT CATTGG A CAT ATTGAAGAAG ATCGCAATAG TAATGTTGAA 10 20 

TCCATTCAAA TTGAACGTAT CGTTCCCAAC CGTTATCAAC CAAGACAGGT GTTTGAACCA 10 8 0 

AATAAAATTA AAGAACTTGC TGAATCAATA CATGAACATG GTTTACTACA ACCTATTGTT 1140 

GTAAGACCGA TTGAAGAAGA TATGTTTGAA ATTATTGCTG GAGAGCGCCG ATTTAGAGCA 1200 

ATACAATCAC TAAATTTACC TCAAGCAGAC GTTATTATTC GTGATATGGA TGATGAAGAG 12 60 

ACGGCTGTTG TTGCATTAAT TGAGAATATT CAAAGAGAAA ATTTGTCTGT TGTTGAAGAA 13 20 

GCGGAAGCCT ATAAGAAATT ATTGGAAATT GGTGATACAA CGCAAAGTGA ATTGGCAAAA 13 80 

AGTTTAGGTA AAAGTCAAAG CTTTATTGCA AATAAGTTGC GTTTATTGAA GTTGGCGCCG 14 40 

AAAGTACTAC TTCGCTTAAG AGAAGGTAAA ATTACTGAAC GTCATGCGAG AgcGGtATTA 1500 

TCATTGTCTG ATAGCGAACA AGAAGCGTTG ATT GAG CAAG TCATTGCACA AAAGCTAAAT 1560 

GTGAAcAGAc TGAAGATAGA GTACGCCAAA AAACGGGGCC CGAAAAAGTC AAAGCACAAA 16 20 

ACCTTCGCTT TGCACAAGAT GTCACTCAAG CACGAGATGA GGTAGGCAAA AGTATC CAAG 1680 

CGATTCAACA AACAGGATTA CATGTTGAGC ATAAAGACAA AGATCATGAA GATTATTATG 1740 

AAATAAAAAT TCGAATATAT AAACGTTaGT AGTAGGATGT CGTATACATG ATGACTAACA 1800 

CATAAAAGAC AAAGCTAAGA TCATAACAGC TTTGTCTTTT TTTTTTGTTT TACGTGAAAC I860 

ATAAAAATTT ATATTTATAT GTTGAT CAGG CTGGTACATA AATCAATGTT CTATGCTCTA 1920 
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TTCTAGTCAA CCTTGCTGGG GTGGGACGAC GAAATAAATT TTGCGAAAAT ATCATTTCTG 204 0 

TCCCACTCCC TAATTTGAGC TGGATATACT TTCATTTGAA CCCTTTATTG CTAGTTTATG 2100 

AAAGTATCAT GAAAGCTTTA TGAACATCGC TTGAGTTGCC TTTACAGTAG AAAATTTAAG 21 GO 

TTTTACACTT TGTGTGAATG ATACGTTTTG TATTGAATTA ATTATAGAAA GGTACGTTGA 2220 

AGATGTTTTC AATTGGAAGT GCAATTCTTC ATTTTGTCAT TGGTGGTATC GCTGTTGCAT 22 80 

TAGCTTCAAT TATTGCTGAT AAGGTAGGTG GTAAGTTAGG AGGTATTATA GCTACTATGC 234 0 

CGGCAGTCTT TCTTGCGGCT ATTATCGCAT TAGCTTTAGA TCATCGTGGT ACG CAATT AG 24 00 

TGGAGATGTC GATGAATCTT AGTACTGGAG CAATTGTCGG TATTCTGTCT TGTATATTAA 246 0 

CTGTATTTTT GACATCTCTC TACATTAAGC ATAAAGGTTA TCGGAAAGGC GCAATATTCA 252 0 

CAGTTGTTTG TTGGTTTGTC ATTTCCCTCG CAATATTCAG TATTAGACAT TTATAGTTTG 2580 

GAAAATGCGT GATAATTAGT TGTATTCAGT TATTAAGTAA TAAATTATTG GAGGCAGAAC 254 0 

ATCATGAAAT TAACATTAAT GAAATTTTTT GTGGGGGGAT TTGCAGTATT ATTAAGTTAT 2700 

ATT GTATCTG TAACACTACC TTGGAAAGAA TTTGGCGGTA TATTTGCaAC GTTTCCGGCA 2760 

GTATTTTTAG TGTCTATGTT TATTACAGGT ATGCAATATG GTGATAAAGT CGCTGTGCAT 2820 

GTAAGTCGTG GCGCAGTGTT TGGTATGACA GGGGTATTAG TTTGTATTTT AGTTACATGG 2880 

ATGATGTTAC ATATGACGCA CATGTGGTTG ATTAGCATTG TTGTTGGTTT CCTAAGCTGG 2940 

TTCATCAGTG CAGTATGTAT TTTTGAAGCG GTAGAATTTA TAGCACAAAA AAGATTAGAA 300 0 

AAGCATAGTT GGAAAGCTGG AAAATCGAAT AGTAAATAGT GTGAACGTAA TCTCTTAACT 306 0 

AGGACTAACT TTGCAAGCAT TGAATAGCAT GGAAAAGTTG CATCATTAAT AAGTGAAATT 3120 

CAAGTTGGCA TTGAGAAAAT TACAAGCGCG TAATCATACa GGTCTGTCTT AAGGGAGTCT 3180 

TCGAACCCCG ATGTTGTCGT ATGTCAAAAC ATTTAGTCAA TCATAAAGGT GACTTGATTT 324 0 

AACTTTATCT GATAGTCTGA TTGTAATGAT TGTACTAATT GACTGGAGGC GTATGTAATT 3 30 0 

GAATCTGAGT AAACAAATTA AAAAGTATAG GGAACGAGAT GGTTATTCAC AAGAATATCT 33 6 0 

TGCTGAAAAG TTATATGTAT CTAGGCAGAG TATTTCTAAT TGGGAAAATG ACAAAAGCTT 34 2 0 

ACCAGACATA CATAACTTAT TAATGAyGTG TGAATTGTTC AATGTAACTT TAGATGATTT 34 8 0 

AGTAAAAGGG ACCATTCCAT TTGTACCTGA TATTAAAGCG CAACGAAGTC TTAACTTATG 354 0 

GACATATGTG AT GCTTATTT TCATGACATT AGCTGCAATT TTAATGGGAC CTTTAGTTGT 3 600 

TTATTGGAAT TGGACTTGGG GTGTAACGGT GGCAATCATT TTGGGAATAG GTTTTTATGC 3660 

ATCTATGAAA ATAGAAGATT TAAAAAAAGT GCATAAAATG GACAACTACG ATCGAATTGT 3720 
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GACAAATGCG 


CTTTCTATTA 


TATCAGTAAT 


TGGTATACTC 


AGCCTCATAA 


TTTTCCTTAG 


3840 


TGTGTATTTG 


GCAAATAAGT 


TTTTATAAAT 


CATCGTGGTA 


TCGTCTCATA 


TTATTTATAT 


3900 


TATCCAAAAT 


AGCATAAAAA 


AATACCAACA 


AGATTTAGAA 


CCTTGTTGGT 


AATCAAAGCG 


3960 


aTTCATTTAT 


AATGAGTCGT 


TTTATGTTGT 


AAGATTAAAC 


AGTTTGTACG 


TTAACTGCTT 


4020 


GGTCTCCACG 


TTGACCTTCA 


GTGATTTCGA 


AAGTAACTTT 


TTGACCTTCT 


TCTAAAGTTT 


4080 


TGTAGCCATC 


GCTAGCGATA 


CCTGAGAAAT 


GTACGAATAC 


GTCTCCGCCA 


TTTTCTTGTT 


4140 


CGATGAAACC 


AAAACCTTTT 


TCTGCrTTAA 


ACCATTTwAC 


TGTACCGTTA 


TT CAT ATwG A 


4200 


AwACCTCCGT 


gTGCTTTTGC 


ACTTAATATT 


TGTAACAAAT 


TCATAACTAA 


AAAAGAGGAT 


4260 


ATTCTAAACA 


AATACACTAC 


AATTTAATTC 


ACGAGCTTTT 


ATTACGTAAG 


ACCAACTATA 


4320 


CGCTCATATT 


GGCATAATGT 


ACAGTGTTTT 


TTGAAAATAA ATTAAAAAAG 


ATTTTTAAAA 


4380 


ACCTTAGAAA 


CGTTGATTTA 


AAGGGGTTTA 


TAAAAATwAw 


AAAATTGTAG 


TCTTTTATGG 


4440 


TGTTTGCTAG 


TTTTCAAAGT 


GACATATCGT 


TTAAACATGA 


TGATTTTATA 


AGCAATCCAT 


4500 


AAAAAACAAG 


CAGCGATAAA 


CGCTACTTGT 


TGATATTAAA 


ATCTGACTTG 


AAAGGTCATA 


4560 


GCAATGTTCT 


ATACCGATGG 


AATGTGCTTA 


CTTGCCTTTT 


TCTTCACGAC 


GTTTTAAATA 


4620 


ATAAGAGCCA 


CCTAATAAAC 


CAGCTGGAAT 


GCCTATCATT 


GGTGTTGTGA 


ATGAGCTTAA 


4680 


TACAATAACA 


AGTATTGTTA 


AAGCAATGAC 


GTTATACCAA 


GTTACAGTCA 


AATTTTTCAA 


4740 


ATCCTCATAT 


GATTGTTTTA 


CTAATTCTCT 


AAATTTCATG 


ATTCAATCTC 


TCCTTTTTTA 


4800 


TAAATCTTTA 


GATTGTCAAA 


TTAAGCTGGA 


CA 






4832 


(2) INFORMATION FOR SEQ ID NO: 190: 









(i) SEQUENCE CHARACTERISTICS .- 

(A) LENGTH: 5727 base pairs • 
T (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 190: 

CAAAGCTGTT CAAAAGGCTT ATAATTTAAA TTTAGATAAC ATACGTACAA TGGAACCTAA 60 

GTTGAGATAT CAAGCGATCA ATAAAGGTAA TATTAATTTA ATAGATGCAT ATTCAACTGA 120 

CGCTGAATTA AAACAATATG ATATGGTTGT GTTAAAAGAT GATAAGCACG TATTTCCACC 18 0 

AT AT CAAGG A GCACCATTAT TTAAAGAAAG CTTTTTAAAG AAACATCCAG AAATTAAGAA 240 

AC CG TTAAAC AAACTAGAAA ACAAAATATC TGATGAAGAT ATGCAAATGA TGAACTATAA 3 00 
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GTTAATCAAA TAACGACCAA CGCCACATAA GATGCGTAAC ACCAAATTAT ATCTTATGTG 42 0 

GCGTTGTTAT ATTTAAATCT ATAATTATGT TCAATTTAAA CATGCAATAA TGATTAAAAA 4 80 

ATATGACATG TTAAACACAA TGTAAGCTAT TATGATGTGA AAATAGTAGC ATTGCATTTT 54 0 

AGAAACATAG AGCGATATAA TGAATATAAG TTTTTTGAAA TTTCAGTTAA TTCTAAGGAG 600 

GTTGTTTTTA TTATGAAAGA ACAACTTAAT CAACTATCAG CATATCAGCC TGGTTTAT CT 6 GO 

CCAAGGgCAT TGAAAGAAAA GTATGGCATT GAAGGAGATT TATATAAACT TGCATCAAAT 72 0 

GAAAATTTGT ATGGACCATC GCCTAAAGTT AAAGAAGCGA TATCAGCACA CTTAGATGAG 7 80 

TTATATTATT ATCCTGAAAC AGGATCACCG ACATTAAAAG CGGCGATTAG TAAACATTTA 84 0 

AAT GTAGATC AATCACGCAT TTTATTTGGT GCGGGATTAG ATGAAGTTAT ATTAATGATT 900 

TCTAGAGCTG TATTAACGCC AGGGGATACT ATTGTTACAA GTGAAGCGAC ATTCGGTCAA 960 

TATTATCACA ATGCGATTGT TGAATCAGCT AATGTGATAC AAGTACCTTT AAAAGATGGT 102 0 

GGCTTCGATT TAGAAGGTAT TTTAAAAGAA GTTAATGAAG ATACGTCATT GGTATGGTTA 1080 

TGTAATCCAA ATAAT CCTAC AGGTACATAT TTTAATCATG AGAGCTTAGA TTCGTTTTTA 114 0 

TCTCAAGTAC CTCCACATGT ACCAGTAATT ATAGATGAAG CTTATTTTGA ATTTGTGACA 120 0 

GCAGAGGACT ACCCGGATAC ACTTGCTTTG CAACAAAAAT ATGACAATGC TTTCTTATTA 1260 

CGTACATTTT CAAAGGCGTA TGGATTAGCG GGTTTACGTG TAGGATATGT GGTAGCAAGT 13 20 

GAACATGCGA TTGAAAAATG GAACATCATT AGACCACCAT TTAATGTGAC ACGTAT AT CT 13 80 

GAATACGCAG CAGTTGCAGC ACTTGAAGAT CAACAATATT T AAAAG AG GT AACACATAAA 1440 

AATAGTGTTG AACGCGAAAG ATTTTATCAA TTACCTCAAA GTGAGTATTT CTTGCCAAGT 1500 

CAAACGAATT TTATATTTGT AAAAACraAAG CGGGTAAATG AACTTTATGA AGCACTTTTA 1560 

AATGTAGGGT GTATTACGCG ACCATTTCCA ACTGGTGTTA GAATTACAAT TGGTTTTAAA 1620 

GAACAAAATG ATAAAATGTT AGAAGTTTTA TCAAACTTTA AATACGAATA GTAAGTGGGG 1680 

AGTGGGACAG AAATGATATT TTCGCAAAAT TTATTTCGtC GTCCCACCCC AACTTGcATT 1740 

GTCTGTAGAA ATTGGGAATC CAATTTCtCT TTGTTGGGGC CCCGCCGGCA AGGTTGACTA 1800 

GAATTGAAAA AAGCTTGTTA CAAGCGCATT TTCGTTCAGT CAACTACTGC CAATATAACT 18 60 

TTGT AG AG CA TTGAACATTG ATTTATGTCT CAAGCTCAAT GCAGTGTGAA TGATGAGGTG 1920 

AGAGTATTCA GTGTAAAAAG CAACAATAGA TGATATTGTT TTGTATCAAT TGCTTTTTTG 1980 

CTATACTGAA TCAATACTGA TATTTTCAGG AGAAGATTAA AATGACCCGT AAATCAATCG 2040 

CGATTGATAT GGATGAAGTA TTGG CAGAT A CATTAGGAGA AAT CATTG AT GCTGTCAATT 2100 
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TTCCTGAACA TGATGGATTA ATTACAGAAG TATTGAGAGA ACCAGGCTTC TTCAGACATC 2220 

TTAAAGTGAT GCCGTATGCA CAAGAAGTTG TGAAAAAATT AACTGAACAT TATGATGTAT 2280 

ATATTGCTAC AGCAGCAATG GATGTACCAA CATCATTTAG TGATAAATAT GAATGGTTAC 2 34 0 

TAGAGTTCTT TCCATTTTTA GATCCTCAGC ATTTTGTTTT TTGTGGTAGA AAAAACATCG 24 00 

TTAAAGCTGA TTATTTAATA GATGACAATC CTAGACAGCT TGAAATTTTT ACTGGTACAC 2460 

CGATTATGTT TACAGCAGTG CATAATATTA ATGATGATCG ATTTGAACGC GTAAATAG CT 2 520 

GGAAAGATGT AGAACAGTAT TTTTTAGATA ATATTGAGAA ATAAAATATA TCACTTGAAA 2 580 

AATTTCATGT AGAAAAGATG ATGGATAGGC TATAAAGTAA TTGTGACTGA GATGAACTTT 2 640 

TATGTCTTAG ACACTACAAC ACTATATTGG CAGTAGTTGA CTGCGGGGCC CCAACATAGA 2 700 

GAAATTGGAT TCCCAATTTC TACAGACAAT GCAAGTTGGG GTGGsCCCCA ACATAAAGAA 27 60 

ATACTTTTTC TTTAGAAATT AGTATTTCTT ATGCATGAGT GTAACTCATG CATT CAT ATT 2 820 

TTTAAGTACA CATTAGCTGT GACTAATGAT AAAGAATCGC TACATAATCA ATCATTAGTC 2 8 80 

GTTCTTTATC ATTTCCGTCC CGCTCTCAAT AAATGTTAGT CTATCTTATT ATTATAAATC 2 940 

GGATGAATGT GTTAATCTAT GGCAGATTAC ACGTCATCCG ATTTTTTATA GAATTTGAAA 3 000 

AAGACGCATA AACCACTATG ATTTAAAATA CAACATCAAT CATTTTAGTG gCATGCGCCA 30 60 

AAATTATATG TCTGTTTTTG AAACAGGGTA ATAGCTTAAA G CTAATAAAA ACGAATATAA 312 0 

GGTGCGTTGA ATCTTATGAT TACACTCCAA ACCTAATATA ATATCGGGTT AAGATCATTC 3180 

CGGATGCTTA CAAATCATTG ACAGTAAGTA ACTGAATGGC ATTTGGTATA ACCTCAATAT 3 24 0 

CAATAGGTGT TTCTAATGAA ATTTCGCCAT CAATATCAAC TTTCATTGCT GGATCTGTTG 3 300 

TAAGTGAAAT CTTTTTACCA GGTATATGCT CAATACCTTG AGTAATTTCA TTCCaATTCA 33 60 

TGCTATCACG CTTTTTAAAA ATATCATTTA AAATACTGAA ACTTTGTTCA TTAAAAATGA 3420 

AAGTGTTCAG TTCACCATCT TGAGGAGACA AATCAGTCaA TGGTATACGA CTACCACCAA 34 80 

TGAATGGACC ATTTG CTGTT AGTATCATGG TCGTTTCGCC AGAATATGTC TTATCATCTA 3540 

TTGATAATTG ATAATTAAAT TGTGTTGGAT TTAGCAGTGT TTTGACAGTT GATCCAATAT 3 600 

AACTCAATTT ACCAAATATA TCTTTTGAAC CATCTTGTAC GTTTTCAGCG TTTTGAACAA 366 0 

TGAGACCTAA GCCAACAAAG TTGAGTGCAT ATTGATTATT TATTTTAATT ACATCGTATG 372 0 

TACCAACTTG TGCAGAAATC ATTTGTTCAC TAG CTTGTTT ATGATTAGGT GCTATATTTA 37 80 

GCGTTTTTGT AAAATCATTA AAAGTACCGC CTGGTAAAAT GCCAATAGGG AGTTGAAGGT 3840 

CATGTGTCAT AACACCGTTT ATAAGTTCGT TAACCGTGCC ATCACCGCCA AGAATAAATA 3900 
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CACCTTCGTT TTCACTCAAT TGAATAGAAA GATGCTTACA AATTGAACTT 


AATGCTGTTG 


4020 




TAACTTCCCC AATACCTTGA TTAATATTTT TTAATCCACT GTGTTCATGG 


TAAAAGAGGA 


4080 




CAC CATGTGT ATATTTATTT TC C AT AGTTT AGCCTACTTT CTAAAAATTG 


GTTCATTAAA 


4140 




TATATATACC CACTTTTAAT TGTTAATACC AAAAATATGT TTTTAAATAG 


AGAAAATGGT 


4200 




AATAAATGAA ATTGATTTCT ATAGAGTGGG ACGAGAAAAT ATAGTTATAG 


CTGTCTATAA 


4260 


10 


TGAGCATATT AAGTTTTTAT TTATACTGAT ATCTTGAATT TAATTAATAG 


AAACCTATAA 


4320 




AAAAACAGTA AGCCATTTAA ATGACTTACT GTTTTTTGAA TTAGGCCAAC 


AATATTAACG 


4380 


15 


TATACCTTTC ATCGCTTTGA TGATTAAAGG TGAGAATGCT AATACAATTG 


TTGTAACAAT 


4440 




AATTGCAACA ACACCTAGGA AAATAAAGTA ATTTGTTTGA CCTAGTGGTT 


CTATTAACTT 


4500 




AACTAAAGTA CCATTGATTG CTTGTGCAGA AGCGTTAGTT AAGTACCAAA 


TACTCATCAT 


4560 


20 


TTGGGCATTA AATGCTTTAG GTGCTAACTT AACAGCAGCA CTATTACCCG 


TTGGTGATAA 


4620 




GCATAGCTCA CCGATAACAC AAATAATGTA CGATAAAATA ACCCAGTTAA 


CTGAAAAGTT 


4680 




TGATGAAC CT GATGCATAAC CTACAATACC AATTAGTATG TATGACGCAC 


CTGCTAAGAA 


4740 


25 


CGTACCAATT GCAAATTTTA CTGGCAGGCT AGGTTGTTTA GTTCCAAGCT 


TTTGCCATAA 


4800 




AAGTGAAATA ATTGGAGCTA GTAATAAAAT AAATAATGGG TTAATTGATT 


GGAAGATCGC 


4860 




TTCACCAAAG TTTGTTTTCC AACCAAATAA GTTTAATTTC ATATCTGAAT 


GTTCAATTCC 


4920 




ATATATGTTT AATACATTAG ACCCTTGTTC TTGAATAGCC CAGAACACCA 


TTCCAAGAAT 


4980 




AAATAATGGA ATAAATG CTT TAACACGAGA ACGTTCAGTA TCAGTGACAT 


CTTTACTTCT 


5040 




AATAATTAAA GTGAAGTAAA TGAnTGGTAA TGCAATACCT AATACTAAAA 


CAGTATTACT 


5100 


35 


AACTAAGTTA AATGATAATG AGTTAGTTAA TGCACCAATA ACGATAATTA 


ATACAATTGC 


5160 




TAAAACAACA CTTCCGATAA TAAGACCATA CTTTTTCTTT TCAGCTGGTG 


TCAATGGGTT 


5220 


40 


AGTAGGTTTC ATACCAACGC TACCTAAGTT TTTGCGGTTG AAAAGTACAT 


ACCATACTAA 


5280 




ACCTAATGCC ATACCAACTG CTGCAATCAA GAATCCGCCG TGGAAGTTTT 


TAACATTAAC 


5340 




AAAGTGTTGC AAAATAATAG GTGATAATAA TGCACCCATA TTAACTGACA TATAGAAAAT 


5400 


45 


AACAAAACCT GCATCCATAC GTCTATCATT TTCAGGATAT AAACGGCCAA 


CGATATTTGA 


5460 




AATGTTTGGC TTCATTAAAC CTGAACCAAT AATGATGAAG AACATTGATG TGAATAAGCC 


5520 




GATTAATGCA AATGGTAAGC TTAAACAAAT ATGTCCGATA ATAATAAAGA 


CTGCACCTAA 


5580 


50 


TAAAGTAGCG CCTCTAGTGC CTGTAATTCT GTCAGCAATC CATCCGCCTG 


GTATTGATGT 


5640 




CATATAGATT AATGAACCAT ArACTGACAT AATTGACATA GCTGTTGTTT 


TATCAATTCC 


5700 



55 
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(2) INFORMATION FOR SEQ ID NO: 191: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14078 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO : 191: 
TGGACTATTA ACGGCGaAGA AGATTTAACG AAATACTTAC AAACCAATGT TGATGGTATT 60 
AT CACAGATG ACCCAGCATT AGCTGATCAG ATTAAAGAAG AAAAGAAAGA CGAAACATAC 120 
TTCGATCGTT CTATAAGAAT TTTGTTTGAA TAATATAAAC AAAGACCTCT AAAGTTATCA 180 
AGATGATACC TTCAGAGGTC TTTTTAATGT TGCCATCTAT GGGATAGGCA ATCGTTTCAT 24 0 

TCGTTTATAT TCATATGACA AGTATTTGTA TGGCAATTTG GCGTCACAAA CACTTACATG 3 00 

ATTTATTGGT GAATTATTAA TTGTTTTGTG AATGCAAAGG GTTAGAAATT GAATTGTAAA 3 60 

TACTTTCTAA TCTTTGTTTC GCTTTAGTCA TTTGATCCAA ATTTTTAGTG CGTATAG CGG 4 20 

ATTTTGCAAT ATAGTGCGCA cTAAAATATC GCGTTTTTGA AACGCATCTA AATTTAGGTA 4 80 

CGATAATTTA TTTAAGT CAG TGTTTG CTAT TAATTCATGT AATTGATCTA CAAGCGCTTG 540 
ATGTTGATAC GTATGTGATG TAGTTTCAGA TTTGCTTGCT AATTTAATAC CAGTCGTATC 6 00 

AAGGAGCGCC GCTTTAATAC CAGCAACTAA ATATGTTTTG ATTTTCATTT GTGTTGTCAT 6 60 

GCTTTGTTAC TCCTTTGATG TACATTAATC AAAAAAATTA TACACTATTG TATATTGCAA 720 
AG CTAATTAA CTATAACAAA AAGATAGTTA ATG CTTTGTT TATTCTAGTT AATATATAGT 780 
TAATGTCTTT TAATATTTTG TTTCTTTAAT GTAGATTGGG CAATTACATT TTGGAGGAAT 84 0 

TAAAAAATTA TGAAAAAGCA AATAATTTCG CTAGGCGCAT TAGCAGTTGC ATCTAGCTTA 900 
TTTACATGGG ATAACAAAGC AGATGCGATA GTAACAAAGG ATTATAGTGG GAAATCACAA 960 

GTTAATGCTG GGAGTAAAAA TGGGACATTA AT AGAT AG CA GATATTTAAA TTCAGCTCTA 1020 

TATTATTTGG AAGACTATAT AATTTATGCT ATAGGATTAA CTAATAAATA TGAATATGGA 1080 

GATAATATTT ATAAAGAAGC TAAAGATAGG TTGTTGGAAA AGGTATTAAG GGAAGATCAA 114 0 

TATCTTTTGG AGAGAAAGAA ATCTCAATAT GAAGATTATA AACAATGGTA TGCAAATTAT 1200 

AAAAAAGAAA ATCCTCGTAC AGATTTAAAA ATGGCTAATT TTCATAAATA TAATTTAGAA 1260 

GAACTTTCGA TGAAAGAATA CAATGAACTA CAGGATGCAT TAAAGAGAGC ACTGGATGAT 13 20 

TTTCACAGAG AAGTTAAAGA TATTAAGGAT AAGAATTCAG ACTTGAAAAC TTTTAATGCA 13 80 
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GTTGTATCAT ATTATGGTGA TAAGGATTAT GGGGAGCACG CGAAAGAGTT ACGAGCAAAA 1500 

CTGGACTTAA TCCTTGGAGA TACAGACAAT CCACATAAAA TTACAAATGA ACGTATTAAA 1560 

5 AAAGAAATGA TTGATGACTT AAATTCAATT ATTGATGATT TCTTTATGGA AACTAAACAA 1620 

AATAGAC CG A AATCTATAAC GAAATATAAT CCTACAACAC ATAACTATAA AACAAATAGT 16 80 

GATAATAAAC CTAATTTTGA TAAATTAGTT GAAGAAACGA AAAAAGCAGT TAAAGAAGCA 174 0 

10 GATGATTCTT GGAAAAAGAA AACTGTCAAA AAATACGGAG AAACTGAAAC AAAATCGCCA 1800 

GTAGTAAAAG AAGAGAAGAA AGTTGAAGAA CCTCAAGCAC CTAAAGTTGA TAACCAACAA 18 60 

GAGGTTAAAA CTACGGCTGG TAAAGCTGAA GAAACAACAC AACCAGTTGC ACAACCATTA 1920 

GTTAAAATTC CACAGGGCAC AATTACAGGT GAAATTGTAA AAGGTCCGGA ATATCCAACG 1980 

ATGGAAAATA AAACGGTACA AGGTGAAATC GTTCAAGGTC CCGATTTTCT AACAATGGAA 204 0 

CAAAGCGGCC CATCATTAAG CAATAATTAT ACAAACCCAC CGTTAACGAA C CCT ATTTT A 2100 

20 

GAAGGTCTTG AAGGTAGCTC ATCTAAACTT GAAATAAAAC CACAAGGTAC TGAaTCAACG 2160 

TTAAAAGGTA CTCAAGGAGA ATCAAGTGAT ATTGAAGTTA AACCTCAAGC AACTGAAACA 2220 

25 ACAGAAG CTT CTCAATATGG TCCGAGACCG CAATTTAACA AAACACCTAA ATATGTTAAA 2280 

TATAGAGATG CTGGTACAGG TATCCGTGAA TACAACGATG GAACATTTGG ATATGAAGCG 2340 

AGACCAAGAT TCAATAAGCC ATCAGAAACA AATGCATATA ACGTAACAAC ACATGCAAAT 2400 

30 GGTCAAGTAT CATACGGAGC TCGTCCGACA TACAAGAAGC CAAGCGAAAC GAATGCATAC 2460 

AATGTAACAA CACATGCAAA CGGCCAAGTA TCATACGGAG CTCGTCCGAC ACAAAACAAG 2 52 0 

CCAAGCAAAA CAAACGCATA TAACGTAACA ACACATGGAA ACGGCCAAGT ATCATATGG C 25 80 

35 GCTCGCCCAA CACAAAACAA GCCAAGCAAA ACAAATGCAT ACAACGTAAC AACACATGCA 264 0 

AACGGTCAAG TGTCATACGG AGCTCGCCCG ACATACAAGA AGCCAAGTAA AACAAATGCA 2700 

TACAATGTAA CAACACATGC AGATGGTACT GCGACATATG GGCCTAGAGT AACAAAATAA 2760 

GTTTGTAACT CTATCCAAAG ACATACAGTC AATACAAAAC ATTACGTATC TTTACAACAG 2820 

TAATCATGCA TTCTATGATG CTTCTAACTG AATTAAAGCA TCGAACAATC GGAAGCATAT 2 880 

4s TTCTAAATTA TTTATT CATT ATAGTCTTAA ACATAACATG ACCTAATATA TTACTAACCT 2940 

ATTAAAATAA ACCACGCACA TCTAAGTGAT ATACGACAAT CACAGCAATA ATAATTGCTT 3000 

TAGAAAGTCG TGCCGAACTG GAACTTACAA GTCTAGTTCG AACACACACT GATGTGAGTG 3 060 

SO GTTTTCTTTA TTTTAAACAT GAACAATCAG ATAAGTTACT AG CATT AG CA AATATTATTA 3120 

AATCAAAGGG CTTCGATTCA TAAAATTTAA AACAATGATT AAAATTAGAC GTGTAAATGT 3180 
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TATTTCACAC AG CTT CATTA ATAAAACGAA ATTGCTTCAA CCCGCTTCAA CTT CAACTGG 3 3 00 

CTTCAACTTC AGCCTACTTC ATTCAATAAC AAAACGAATC CGCTTCATCC AAAATCAACC 3 3 60 

ATTCTAACGC ACATATTCAA ATATAGCAGC TGCACCCATG CCGACACCAA TACACATCGT 34 20 

AACCATGCCG TAACGGCTAT CGGGACGTCT ACCCATTTCA TTAAGTAAAC GCGCGGTTAA 34 8 0 

CATTGCGCCT GTAGCACCTA ATGGATGACC TAAAGCAATA GCGCCACCAT TCACATTCGT 3 54 0 

ACGTGATATA TCTAGACCTA CTTCTTTAAT AGATGCAATC GTTTGAGAAG CAAATGCTTC 36 00 

GTTCAATTCG ATCAAATCAA TGTCTTCAAC AGATAGATTG CTGAGTGACA ATACTTCAGG 366 0 

AATCGCATAT GCAGGCCCAA TACCCATAAT TTTCGGGTCA ACGCCTACTG CCTTAAAACC 3720 

AACGAATCGT GCAATAGGTG TCACGCCGAG TTCTTTCACT TTAT CTCCAG ACATTAAAAC 37 8 0 

TACAAATCCT GCACCATCAG AAAGTGGGGC AGATGTTCCT GCAGTCATAG TGCCGTCAGC 384 0 

TTTAAATACT GTACGTAATT TGG CTAATGC CTCCATCGTG GTGTCAGGGC GTATAAATTC 390 0 

ATCTTGGTCA AAGATATTTG TGTGTACTTT TGGTCCTGCG TTTGTATATT CAACTGAGTT 3960 

TACTTGTATT GGAATAATTT CATCTTTGAA CCGACCATCA CGTTGTGCGT CATAGGCACG 402 0 

TTGATGACTT CTGACAGCAT AAGCAT CTTG ATCTTCGCGT GATACGTCAA ATTGGGATGC 40 8 0 

TACATTTTCA GCAGTTAAAC CCATAGGATA TGACGCACCT ATATCATCAT ATTGTAAGGT 414 0 

TGGATTGTTT GTGGGCTCGT TGCCACCCAT TGGTACGGCA CTCATCAATT CAACGCCACC 420 0 

AGCTACAAGT ATATCTCCTT GACCAGCCAT AATTTGATTG GCTGCAATCG CGATGGTTTG 426 0 

TAATCCTGAT GAGCAGTAGC GATTCACTGT TTGACCCGGT ACCGTGTCAG ATAATCCCGC 432 0 

ACGCAATGCA ATCGTTCGTG CAATGTTTTG GCCTTGTAAT CCTTCTGGAA AAGCCGTACC 43 8 0 

AACAATGACA TCTTCAATCA TATTCTTATT GAATTTTCCG TCAATACGTT TCAATACGCC 444 0 

TTGTAATACT TTGGCTGCGA CATCATCAGG TCTTTCGTGG AATAATGCGC CTTGCTTTGC 450 0 

TTTCGCTGCG GCTGAACGCC CATAAGCTAC AATGTATGCT TCTTGCATGG TTATCATCCT 456 0 

CT CTTAATG A CTATCTTTTA ATTACGTAAT GGCTTACCAG TTTTTAACAT ATGTG CAATT 4620 

CTTTCATATG ATTTTTTAGA TTTTAGTAAG TCAATAAAGC CAATTTTCTC CAACGATTGA 468 0 

ATGTAACGTT GATTGATAAA TGTATTTCTT GGTAAATCAC CACCCGCTAA AATTGTGGCG 474 0 

ATATTTAAGG CAATATGATA ATCATGGTCG CTAATAAAAT GACCCCGTCT TTGCGCATCT 4 800 

AATTGTCCTT GGATCAATGC TTTGAAGTCT TCACCTAAAG CGATATATTG ATGTCTAGGA 4 860 

TTCGGAATAT AGTTTGTTTC TG CTTCATAT TTCGCACGTT TGAGCGCAAC TTCGACACGT 4 92 0 

TGTGCTGTAT TGAAAATAAT CGTAT CTGTA TCACGTAAAT AACCATAACG ACGTGCCTCA 4 980 
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TGTTTGTCAT CAAACTTATG CGATGTGCGT AATATGCGAT CAGCCATTTC TGCAAGGCCA 5100 

CCGCCACTCG GTAATAAGCC AACACCTGCT TCAACAAGAC CGATATATGT TTCACTTGCA 516 0 

5 GCGACAACAA TAGGTGAGTA AAGTACAAGC TCACAGCCAC CGCCTAAGGC ACGACCTTGA 522 0 

ACAGCTGTGA CTACTGGTTT CAAACTATAC TTCAAACGAT TAAAGCTATA ATGTAATTTA 5280 

TCAATTGATT GTGCAACGAC ATCATCTACA AGACCGTCTT CATGCGCCTT TTTCATTAAG 534 0 

10 AAAAGGTTAG CACCCACACT GAAATTGTTA CCAT CTGCAT AAATAACCAT ACTTGTGTAA 5400 

TGGTCATTTT CCAGTAAATC AATCGCATCA ACTAACGCAT CGTTGAATTC ATCGGTAATG 54 GO 

ACATTATTTT TACTTTGTAA TTTCAGTAAC AGTTGATCAT CATGAGTTAC GGAAAGTTTG 5520 

is 

GCATCACCTT TATCCCAAAG TTCAT C TTTT ACGAAGTGAG AAATAGGTGT TGCATATTCA 5580 

ATGGTCTCAT CTTGTTTATA AAAGCCACCA TCTAAATCAC TAATCCATTG TGGTAAGTCT 5640 

CCAAGTTCGT CTTCCATACG TGTTTTAACA CGTTCGTATC CCATTGCAT C CCATAATTGG 57 00 

20 

AATGGACCAA GTTTCCAGTT GAACCCCCAG ACAAGCGCAC GGTCTATGTC TCGGAAATCA 5760 

TCGGTAGCTT TAGGTACATT GATAGCAGAG TAATAGAAAT TATTACGTAA TGTCTCCCAT 5820 

25 AAAAATAGTC CCGCTTCGTC TTGCGCATTG AATATGGTAT CAAGGTTATG CACTAAGTCT 5 8 80 

TTATTAAATT CATTTAAAAT TGGTAATTGT GGTTGCGATA CAGGTACATA ATCTTGTTTT 5 940 

TCAACATCGT AAACAAGTCG AGCTTTAGTT TCTTTATCCT TTTTGTAAAA TCCTTGTTTC 6000 

30 GTTTTACGTC CGAGTGCGCC ATTGTCAAAC AACGTATTTA CAATTTTGAC ATCATGAAAA 6 060 

TAAGGTGTTT CTTCAGGTAC TTGTTGCATG CCTTTAATTA CAGACACTGC AAT AT CT AAA 6120 

CCGACTAGGT CAGATAGCGC ATATGTAC CT GTTTTAGGAC GAC CAATCGC TTGCCCAGTT 6180 

35 AAAG CATCCA CATCTACAAT GCTTATCTTG TGTTGCTCGG CGCGATACAT AATATCATTC 6 240 

ATTGTTTGCG TGCCGACTCT ATTTGCGACA AAGCCAGGCA CATCATTGAC GACAATGACA 63 00 

CCTTTACCTA ACACATTTTG CGCGAAATTT TTTACATCTA ATATAATAGA TTCCTTCG TG 63 60 

40 TGTGACGTAG GTATTAACTC CACTAATTTC ATAATACGTG GTGGGTTAAA GAAATGTAGA 6420 

CCAAAGAATC GTTCTTGATC CTTCTCGTTA AATGCTTGAG CAATCGCATT AATTGGAATA 64 80 

CCTGATGTAT TTGTAGCGAA TAAAGCATCT TCTTTAGCAT GTTGTAGAAC TTGTTGCCAA 654 0 

45 

ACAGCATGCT TAATTTCAAT ATCTTCTTTG ACTGCTTCGA TATATAAATC AG CAT CAT CA 6600 

TTTACCAAGT CATCATCAAA ATTACCATAT GTTAAATGAC TCGCTAGATT TAAGTCGAAT 6660 

so AGTAGCGGCC GTTTCTTATC TGTAATTTTA TCGTAAGATT TTTTCGCAAT GAGATTTGGA 6720 

TCGTTTTTGT CCACTACAAT ATCTAATAGT TTTACTTTAA GTCCAGCATT CACAAAAAGT 6780 

55 



890 



EP 0 786 519 A2 

GTGATTCCTC CAATTTAGTT GAGGATAAGA TAACCATTAA GATAATTGGA ATAACGTTGC 6 90 0 

TATTTTATAA AATTAATTAA GT AT CTTTG A CAGTCATCTT AGCCTCTTAT TTAAGGAAAA 6 960 

5 AGCTTTATGC TTAAAATAAG TCTTTTTTAG TGAAATTAAT GCATCTCATA TAATTATTTG 7020 

CTATTTATAC GAAAGCAGAA TCTCCAGTCA AAGCGCGTCC AATTACTAAG GCATTAATTT 7080 

CATGTGTACC TTCGTACGTG TAAATCGCTT CTGCATCAGA GAAGAAACGT GCAATATCAT 714 0 

10 AATCGTCAGC TAGTATG CCA TTACCACCTG TAATACCGCG GCCCATAGCT ACTGTCTCAC 7200 

GCAAACGTAA GGCATTCATC ATCTTCGCCG TTGAAGTTGC AACCTCGTCA TATTCACCAT 72 6 0 

GTGCTTGCAT ATTAGCTAAT TGAGCACATG TTGCCATTGC TTGAG CTAAA TTACCTTGCA 7320 

15 

TCATTGCTAG CTTTTCTTGT ATTAACTGAT ATTTACTAAT TGGTTTGCCG AATTG CTTAC 7 380 

GCTCAGTGAC ATAATCTAAT GTGGCACGTA AAGCGCCAGC CATACCACCT GTAG CCATAT 744 0 

2Q AAGCAACGCC TGCTCTCGTT GAATAAAGAA TTTTGGCAAT ATCTTTAAAG CTTGTTATGT 7500 

TTTGTAAGCG ATCCGCTTCA TCTACTTTGA CATTAGTTAA TTTAATTAGG GCGTTAGGAA 7560 

CAATGCGAAG TGCGATTTTA TTATCAATGA CTTCAATATC GACGCCATCT TGTTCTGGTC 76 20 

2s TGACTACAAA GCAATGGGGT TTGCCAGTTT CTTTATTTAC TGCGAATACT GGAATGACAT 76 8 0 

CAGATACATG TGCACCACCA ATCCATTTCT TTTCACCATT GATAACCCAA GTATCGCCTT 774 0 

GGCGTTCAGC GACTGTTTCA AGACCTCCCG CAACGTCCGA ACCGTGTTCT GGTT CAGTT A 7800 

30 AAGCAAAGCA TGTACGCAGT TCATGTGACT GTAATTTAGG TACATATTTC GCAATTTGTT 78 60 

CTTTGCTACC TCCGAAATAG AAAGTGTTAT GCCCTAAACC TTGGTGAACA CCGAGTAGGG 7 920 

TAGCTAAGGA AATATCAAAT CGCG CGAGTA GGTAAGACAT GAAAAACTGA AATAGTTGAC 798 0 

35 TAGGCATTTT GGCGTTTGGA CGATCCTTGT AAAGTAATGG ATTGTTAAAA TAATTTAATT 804 0 

CTCfcAGATC TTTAAAATAG TCCTCGGGTA CAGTAGCGTC TATCCAATGT TGATTAATAT 8100 

TTTCACGGTA CTTACTTTCT AG CAAT GAAT CTACTTGTTG TAAAAATTCG ACTTCACCGT 8160 

40 

CTGTTAAACC TTTAGCAATA CTAAGTACAT CTTCAGGAAA TAATGTTTTT AAGACCGTTT 82 20 

CTTTTTCAAA TGTCATATAA ATTCCTCCTA AAAATAATAT GAAT ACT AAT GTGAAATGCA 82 80 

TTTAATTCAA AAACAACACG CTTTATTTGT AAAC GCTTAC ACTAAATGTC AAAAATTTTT 8340 

45 

ATCACCTTTA AAGTGTTTGC GAGACTTTGT CATTCATCAT TTGTCGAATC GCAAGTTTAT 84 00 

CTGGTTTCTG CGTACTGTTT AACGGCATAT GTGTCACTGG TACATACATT CTTGGGACTT 84 60 

50 TATAACCTGC TAAACGACTt CGCATATGTT GATTTAAAAT TTCAGCGTAA TGAGGTTCAT 852 0 

CTTCGCGAAG TATAATGGCT GCAGCAATTG ATTCACCATA TTTTGGATGA TCATAGCCAA 858 0 
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AGACATTTTC GCCACCAGTT ATGATTAATT CTTTTTTGCG GTCAATAATA AATATATCGC 8700 

CATCGTTGTC CATCTTCGCT AAGTCACCAG TTAATAAATA TCGACCATGA AATGCTTTGG 8760 

5 CAGTCTCTGC TGGTTTATTC CAATATCCTG GCGTGACATT TTTAGCCTTA ATTGCAAGTT 882 0 

CGCCAATCTC ACCAGTAGGT ACTTCCTCAC CGTTAT CATC AAGGATACGT GCATCAACGA 88 8 0 

ACATGACTGC TTTACCAATA CTCATTGGCT TACGTTTTGA ATTTTCCGGT GTATTAACAA 894 0 

10 

GTACAAGAGG TGCTTCAGTT AAACCATAGC CGTTAATAAT GTTTATGCCA TATTGTTTAA 900 0 

AAGCTGCTTG GATACTTGGT AATGGTTGTG AACCACCTTG GATGATATAA TCCATAGCTC 906 0 

TAAAATTTTC AGGATTAAAA TTACTAGCAC GTAGCGTACT ATAATACATT GTC GGAATCA 9120 

15 

TGATAATAAA TGTAGGGTGA TATTGTGCAA TCATGTCATT CAATTCTTCG CCGTTAAAGT 9180 

AACGTTGAAG AATAAGTGTG CCACCTGACA TTAATACTGG TAATACAGTA TCGTTAAACC 924 0 

2Q CTAAAACATG GAACATTGGT GTTGATACAA TCGTAATATA GTTTGAATTG AACTTATACG 93 00 

TCAGCTCTAA GTTTGCACCG TTATGAACAA ATGATTCATA TGAGAACATC ACACCTTTAG 9360 

GTGATCCGGT TGTACCACTT GTATAAATTA ATGCT GCAAG ATCTTGTGGT TCAACAGGTG 94 20 

25 TTGCTTGAAA AGGTTGGTGA TAATCTGGAT TTACGATTTC ATCATATTGC GCCACATCAA 94 80 

TATCCATATG CAATAAGTTT TGGTCAATAT CGGTGAGTGA ACTTAAATGT TTTTCAGCAT 9540 

AGAAGAG CAG TTTTAATTGT GCATCTTCCA CAATGGCTGC AATTT CTTTT GGGTTAAGCC 9600 

30 GCCAATTCAA TGGTAAAAAA ACCGCACCTG TTTTAAAACA AGCAAACAAT AAATCTAATA 9660 

TTGCAATATC ATTTGGCGCA AAAATACCGA TAACATCGCC TTTTTTAACA CCTTGAGATG 9720 

TTAAATAATG TGCCATATTA TCAGCGCGTG CATTGAGTTG TTGGTATGTC CAAGATGTTT 9780 

35 GTTTTGCGTG ATCAATAACG G CAGGCTTGT CATCATCGAA GTCTGAACGC GTTTTTATCC 9 84 0 

AATCGAAATT CATTAGTATA CCCCCTTTAG CTTCACTTTC ATACTTTATG AATTGATTGT 9900 

TTAAGTTGTC CCCATTTTTC TTTGTAAATG CTGGTATCAA TTAATTTTAA ATGATCAGCA 9960 

40 

ATAATTGGTT TAAAAGCCAT TTGATTCAAA ATATCTTTAT GCAAATCAAG ACCTGGTGCA 10020 

ATTTCAATTA GTTTCAAGCC TTGATTGGTG AGTTCGAATA CTGCACGATC AGTAACAAAA 1008 0 

4S TAGATTTCTT GCTCGAGTGA TTGTGAATAT TGTGCATTAA AGTCGATATG GCTCACATCT 1014 0 

GATACAAATT TCTGGTTTTG TCCTTCAGTT TCAATGTTTA ATCGTTGATT ATGGCATGAG 10 200 

ACATGACTGC CAGCTACAAA AGTACCTGAA AAGATAATTT TATTTACAGA TTGCGTAATG 10260 

SO TCTATAAAGC CACCACATCC ATTTAGTCGG TCATTGAAGT AAGACACGTT GACATTGCCG 10320 

TATTGATCAA CCTCAGCAAA GCTAAGATAG GCAACTGATA CACCATTGTT ATAAATAAAA 10380 
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CGACTCCCAA CGAATCCACC GAAAATGCCA ACATCTAAAA TCGGTTGCAC ATCATGTTCA 10 500 

ACACATTCTT CATGCAATAA ATTAGAGAGT TCATTATTGA TGCCATAACC GATG CTAATT 10 560 

5 GTATCGCCAT AAGTTAAAAA CTGAGCAGCA CGTCGGAGAA TCAATTTGCG ACTATTAAAA 10620 

GGTAATGCGG GTTCAGGTAT TCCATCAATT CGTTCTTCTC CAGACAAGGC TGGTAAATAA 10 6 80 

TGACTTTGAA TTACTTGGCG GTGATTCTTT TCATCTTCTG TGACGTATAC ATAATCGACA 10 740 

AGATTTCCTG GGATAACAAC TTCATTCGGT TTTAGTTGAT AGTCGTCAAC TAAAGCTTTA 10 8 00 

ACTTGTACAA TAACTTTCCC ATGATTGGCT TTCGCGTTTA ATGCGACATG ATAACACTCG 10860 

CTCAAGTACG CTTCTTGAGT TAAATAAATG TTACCTTGTT GATCTGCGTA TGTTCCTCTC 10 920 

15 

AGTAGTGCCA CATCAACGCT AGGGAATGTG TAATGTAAGT ATGTTTCATC GTTGATGGTT 10 980 

ACTAATGAAA CTAAATCATC CGTTGTTCGT GTATTTACTT TACCGCCACC GTATCTAGGA 11040 

2Q TCAACAGCTG TGTTTAATCC GATTTTAGTA ATAACTC CAG GTAATAATTG ATTACTCTGA 11100 

CGATAATGAG TTGCAATGAT ACCTTGT GGT AAAAAATAAG CTT CAATGTC ATTATTTTTC 11160 

ATTG cTTGTG CCGTTTTGGA AGAAGCCGTT AAAATACTCA TAATGACACG TTTAATCATG 11220 

25 CGACGTTCTA TAAAATCATC TAAATCCGGT GCGGCACCTA AACTATGAAT ATCATTCGCT 11280 

AATATAAACG TTAAATCATT GGGCGTATGA TATGTGTCAT GTTGCGCTAA CACAGCACGT 11340 

AGAACTTCGG CGGGTAAGTT GGCTACAGCT AATGCTGGTA AACCAATCAC ATCACCATCT 114 00 

30 TTAATGATAT GTTGTAAGTC GTGCCATGTG ATTTGTTTCA AGCAAGT CAC CTCCATCACA 114 6 0 

TTTGATAAAA TATAGCGTTT TTACACTTTG TGTAAACCCT TaCAAGAAAT ATAACATAAC 11520 

GACGTTTAAA ATCAATTAGA AATATCTTTT TATTCTGATA ATAGACACAG TATAGACACA 11580 

35 TTTTGATGGT CGATAACAAT TGTAATATCA AGGGTTTGTA ATGAATTGAA TAT CATTAAA 11640 

ATACTTATAT AAAAATATTG TTCGGAATAT AAAAAGTTAA ATAGGTTTTG ATTTTTAAAT 11700 

ATGAAATACA AAGTGCCCAA TCGAACAAAG TATTTATATT AAAATATGGA AAATCCATCA 11760 

40 

ATATTAAATT AAAATAGTTT TATTATGAAA AGTGAAAGTA GGTAAGTCTA TGGAAGGTCT 11820 

TAAT CATCGA AGAAATACAG AAAAAGAAGA GACAACACAA ACGCAATCaG TTGCACCTAA 118 80 

45 TACAGGTGAA GAGGGGATGT CATCAG CAAG TACACAATCA ACTAAGACGT CCGACATACA 11940 

TAATGAATCT ATCGATAAAC AAATGGAAGC TAAAGCGCAT GAAACAGCGC AAAATACAGA 1200 0 

TTTAAAAAAC GAAGCAAGAA GTTTATTTGA TAATGCAACC AAATCAATCG GTAGACTAGC 12060 

SO GGGCAATGAT GAAAGCTTAA ATCTTAATTT AAAAGATATG CTTTCTGAAG TATTTAAGCC 12120 

GCA TACT AAA AACGAAGCAG ATGAAATATT TATAG CGGGT ACTGCTAAAA CTACGCCAGC 12180 
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TTTCACAGTA ACATTTATTG GATTATGGGT CATGGCAGCA ATTTTTAATA ACACTAACGC 123 00 

GATTCCGGGT CTCATTTTTA TAGGGGCTTT AACAGTACCA TTATCGGGTT TGTTCTTCTT 12 3 60 

5 TTATGAATCA AATGCGTTTA AAAATATTAG CATTTTTGAA GTTATTATCA TGTTCTTTAT 12420 

TGGCGGCGTA TTTTCATTAC TAAGTACGAT GGTATTATAT AGATTTGTCG TTTTTAGTGA 124 80 

TCAATTCGAA AGGTTTGGTT CTTTAACATT TTTCGATGCA TTTTTAGTAG GATTAGTTGA 12540 

W AGAAACTGGA AAAGCACTCA TTATTGTTTA TTTCGTCAAT AAATTGAAAA CAAATAAGAT 126 00 

TTTGAATGGA TTATTAATCG GTGCTGCTAT TGGTGCAGGG TTCGCAGTTT TTGAATCAGC 12 6 60 

AGGTTATATT TTGAATTTCG CTTTAGGAGA AAATGTC CCA TTATTAGATA TTGTCTTCAC 12720 

75 

ACGTGCGTGG ACTGCGATTG GTGGTCATTT AGTTTGGTCA kCGATTGTTG GTGCTGCAAT 127 8 0 

AGTTATTGCG AAAGAACAGC ATGGCTTTGA ATTCAAAGAT ATTTTTGATA AACGCTTTTT 1284 0 

2o AATATTCTTT TTATCAGCCG TTGTTTTACA TGGCATTTGG GATACATCTT TAACTGTACT 1290 0 

TGGCAGTGAT ACGTTGAAAA TATTTATTTT AATCGTTATT GTG TGGAT AC TTGTATT CaT 12960 

TTTAATGGGG GCAGGTTTAA AACAAGTGAA TTTACTGCAG AAAGAATTTA AAGAACAACA 13 020 

25 GAAAAAAGTA GACGAATAAT AATTAAAGCT TATGTTGCTC ATATGTTTGT GACATAAGCT 13080 

ATTTTTATAA TTTGTCTTTA AAAGAGTGGA ATAGGAATAC TTTTTGGAGT TAAAAAAGTG 1314 0 

TTtCACGTTA AACAAATAGT GACAATTAGA TTTATATAAA ATGAACATGA TTCACTGAAA 13200 

30 GTATGTAATA ATCATTTTAT TGAAATTCAT CAAACAGAAA TTAATACAAT CAT ATAAG CA 13260 

AATTAAACCA CGCCATAATC ATATTGGATG ACTTCGGCGT GGTTTTTATA GTTGAAGCAG 13320 

GGCTGAGACA TAAATCAATG TCCCACACTC CCTTATCGTT CAATCGTTGT TCGATAATCG 13 380 

35 ATTAAATAGA TACCTTCAGG TGTTACTTTA TAATTTTTAA CCTTAGAGTT AGCAGCGACT 1344 0 

ATTEGATCGT TGTAAGCAAT ATAACTGTTT GGTACATCTC GACTTGATAA TTTAATAATA 13 500 

TCATTAGAAA TATTGTGACG TTCCTTAACA TCTACAGTAT GATT CAATTG ATTAATTAAA 13560 

40 

TCAT CGACGT TGCTATTATT GTAGTCTCCT TTATTAATAG CACCATCTTT TTTATATGCT 13 620 

TGATTAAAGA AATAACCTGT ATCTCCACGA GGAATTGTTC CGAAACTATA CATCGTTGCA 13680 

^ TCCCATGCAG AACGGTCTTT TAAGTAACCT TCTATGTCAT CAACACTTTT AATGTCGATT 13740 

TCAATATTTG CTTTTTTAGC ATCTGATTGT AATACTTGCG CAATTTTCGA TAGCTCTGGA 13800 

CGACCGTCAT ACGTAATTAA CTTAATTTTT AAAGGGTGTT CTTTTGTATA ACCATCTTTA 13 860 

50 GCTAATAACA TTTTTGCTTG TTCGATATTT TGTTTGGTTA ACTTAGGTTC TTTAATATAT 13 920 

GGAATTTTAT CATTAAATGG ACTCGTTGCA GGTTTCGCAT AACCTTGATA AATATGATCT 13980 
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TTATtAGTAT GATTATACAT AAGTaAGAAG TTCTAAAn 
(2) INFORMATION FOR SEQ ID NO: 192: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 4 86 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 192: 

TGAAAACTAA AGTGTTTCTA ATGCGTGACT AAAATTAGTA ATAATTAAGT TCTCATGATA 60 

ATAGGTATTT TTGAAAAATG GAGGAGTCTA TAAATGGGTA AAAAAATGGG TCTAGGTTTA 120 

TCTATTGCAT TGGTTGTTAT TGGTATTGCC GTTGTATGTT TAATGATTTT TTCTAGTCAA 180 

AAAACGACTT ATTTTGGTTA TATGAATAGT AAT ACAAAT G CAGAAAAAGT TGTCAGTGAA 240 

AAAGATGGAT TAGTCAAACA TAATAT CAAA GTAG AAC CAT CTAATGATTT CAAGCCGAAA 3 00 

AAAGGAGACT TTGTAAAATT AGTTTCTAAA GATGATGGGA AGACATTTTA TAAACAAGAG 360 

ATTGTTAAAC ATGATGACGT CCCACACGGT TTAATGATGA AAATTCACGA CATG CATATG 420 

AATTAATAAA AAAGCATCTA TAACGTAATT TTGAAGAAGT AGAGTTATCT TCTTATGCGT 4 80 

TTTAGA 4 86 
(2) INFORMATION FOR SEQ ID NO: 193: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1626 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 193: 

GAGGTCTATA TACAATTATG GTTGTTC CAG TTAAACGAAC TGATGGCTTT ATTACTAAGT 60 

TTAATAGATT AATTGAAAGA CGATTATTAC GTCATTTCAG TAAAAAAGGT TATATCACAT 120 

GGGAGGAAAA TTGATTGTCT GACATTTTAA AATGTATCGG TTGTGGTGCG CCACTTCAAT 180 

CTGAAGATAA AAATAAACCT GGTTTTGTAC CAGAGCATAA T ATGTTT CGT GATGACGTGA 240 

TTTGCAGACG TTGTTTCCGC TTGAAAAATT ATAACGAATT CAAGATGTAG GATTAGAAAG 3 00 

TGAAGACTTT TTAAAATTAT TATCAGGACT TGCGGATAAA AAGGGTATTG TCGTCAATGT 360 

CGTGGATGTA TTTGACTTTG AAGGATCATT TATTAATGCA GTTAAACGTA TTGTCGGAAA 42 0 



895 



EP 0 786 519 A2 



TCGAGTTAAA GAATGGTTAA AACGAACAGC AAGAAAATAT GGTTTGGAAG CTGACGATGT 540 

CGTATTAATT T CAG CTG AAA AAGGCTGGGG CATAGACGAC TTATTATCAT CAATTGCGAA 6 00 

TATTCGAGAA AATGAAGATG TGTATATTGT AGGGACAACG AATGTTGGGA AATCTACATT 6G0 

GATTAATAAA CTGATTGAAG CTAGTGTTGG TGAAAAAGAT GTAGTAACAA CTTCAAGATT 720 

CCCTGGAACA ACTTTAGATA TGATAGATAT TCCTTTAGAT GAAACATCAT TTATGTATGA 78 0 

TACACCAGGT ATTATTCAAG ATCACCAAAT GACGCATTTA GTTAGTGAAA AAGAATTGAA 84 0 

AATTATTATG CCTAAGAAAG AAATAAAACA ACGCGTATAT CAATTAAATG AGGCGCAGAC 900 

ATTATTCTTC GGCGGTCTAG CGCGCATAGA TTATGTATCA GGTGGTAAAC GTCCGTTAGT 960 

TTGTTTCTTT TCTAATGACT TGAATATACA TCGTACTAAm ACGGAGAAGG CTAATGATTT 1020 

ATGGCGTAAT CAACTTGGCG ATTTATTAAC GCCACCTGGA AATCCACAAA ATTTTGATCT 10 80 

TAATGAGGTA AAGGCTGTTA GACTTGAAAC AGGCAAAGAG AAACG CGATG TTATGATCTC 114 0 

TGGTCTAGGC TTTATAACTA TAGGACCAGG GGCTAAAGTA ATCGTTCGTG TTCCTAAAAA 1200 

TGTTGAkGTT GTATTAAGAA ATTCTATTTT ATAAGGTGaT TAAAAAAATG AAATTTGcAG 12 60 

TTATAGGAAA TCCTATTTCA CATTCCTTGT CGCCCGTTAT GCATAGAGCA AATTTTAATT 1320 

CTTTAGGATT AGATGATACT TATGAAGCTT TAAATATTnC CAATTGAAGA TTTTCATTTA 13 80 

ATTAAAGAAA TTATTTCGAA AAAAGAATTa GAAGGCTTTA ATATCACAAT TCCTCATAAA 1440 

GAACGTATCA TACCGTATTT AGATTATGTT GATGAACAAG CGATTAATGC AGGTG CAGTT 1500 

AACACTGTTT CGATAAAAGA TGGCAAGTGG ATAGGGTATA ATACAGATGG TATTGGTTAT 1560 

GTTAAAGGAT TGCACAGCGT TTAnCCAGAT TTAGAAAATG CATACATTTT AATTTTGGGC 162 0 

GCAGGT 1626 

(2) Information for seq id no: 194 : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 63 5 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 194: 

AGGGTTAATT GTCGGTTTAA TTGCAATGAA TAAGTTCCAT GTATTAGCTG GCTATAGAGC 60 

GAAATTCATC TTAATGGTGA TTTTAACTAT GATGGTCTTC GTACTTATTA ATACGTATTT 120 

ACTAAGACAG GTAAAATCTA TCGGTATGTT CTTAATGATT GCTGCATTGG GTCTATACTT 180 
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GTCTTATATC GATAACATGT TCTTCAATTA TTTAAATGCA GAGCATCCTA TAGG CTTGGT 



300 



GCTAGTAATA TTAACAGTAC TTGTGATTAT TGGCTTTGTA CTGAACATGT TTATAAAACA 



360 



CTTTAAGAAA GAGAGAT TAA TCTAATGTTG ATGAATAGCG TGATTG CTTT AACTTTTTTA 



420 



ACAGCATCTA GCAATAATGG CGGACTTAAT ATTGATGTGC AACAAGAAGA GGAAAAGCGA 



480 



ATCAATAATG ATTTAAATCA ATATGATACA ACGCTATTTA ATAAAGACAG CAAAGCGGTT 



540 



AATGATGCGA TTGCTAAGCA GAAAAAAGAA CGACAACAAC AAATAAAAAA TGATATGTTT 



600 



CAAAATCAAG CGAGTCACTC GACTCGCTTG AATGA 



635 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 195: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13715 base pairs 
(8) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 195: 

CTGAAATGGG TATTATTTGT CTTCTTCATC ATAAAGTAAT AAAGATTGTT CATCATTGCG 60 

ACGTTGCCAA TTTTCATTTG GCGATCTTGG AACGTATAAT AATTGCCTAG TAGCATACGC 120 

TTTGATTGAA ACATACAAGT CATTCCTTGA ACTTGCACCT CAATTTCCAC ATTTGAATTT 180 

TCTTTTATAT TAATAATTT C ATCCAAATTC AGCTCACGTG CTAAGACAGC TCTTGATGCG 240 

CCTCTTTTAC CCCAGTAATT ACATTGAAAA TGATTAGTTA CTAACGTCTC TGCATTCCAA 300 

TGAAGTGG TA TTGGATTTTC TTGCGCCTTC ACATACATTA CTACTGCTGG ATCCCCGAAA 36 0 

ATAATTCTGT CAACT CGTAT TTCATGTAAA AAATTAATAT AATCTTCTAC AGCATCTAAA 4 20 

TGATAATTAT GAAATAATCC ATTCACTGCC GCATATACTT TTTTATCGTT TTTGTGAGCT 4 80 

AATGCGACAG CCTCTGTCAT TTGTTGTCTA TTGAATTCCC CTG GAAGTCT TAAACCAAAC 54 0 

TTTTGCTCGC CAATTACAAA AGCATCTG CA CCTAAATCAA TAAGTGTTTC CATATGGCTT 600 

AATGACTTGG GTGTGACAAG TAATTCTGTC ATAGTCATTC TCCTTTAATT GAAATCGCTA 6 60 

ATCCATCGTC TATATTTAAA AAATTCGTTG TATATCCTGG TTGCTTTATT AACCACTCAT 720 

TATAATCTTG AACCTTTTTA ACCATTTGTC TTACATTTCT CGAT CTAACA ATCCCAATAT 780 

CCGATACAAA ACCGTGATAT AAAACATTAT CTGTAATTAC GAGACCTTGG TGCTTTAAAA 840 

GTGGTGTATA TATTTCAAAA AATTTCTTTG ATTGCGCTTT TGCTGCATCA ATAAATATCA 90 0 

TATCATAAAC TTTGTCATTT ACATTTTCAA ATTGCTCTAA AGCATTACCT TCAATAATTC 96 0 
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CATTACGCTC TATCGTTGTG ACATGAATGT CATCAGATAT AGAAGCGAAT TGCATAGAAC 10 80 

TATAGCCGAT TGCTGTACCA ATTTCTAAAA TATTTTTAAC ATTATTCATA CGAATTAATT 114 0 

GCTTAATTAA ATCTAATGTT AAACGATCTA CAATTGGCAC TTCATTTACC TCGGCAAATT 1200 

CACGCAAAAC TTCGATTGAA CTATTTTGAT GTTGATGTAA ATCTATTAAA TATTTTTTAT 12 6 0 

TTAGGTCATC CATGTTTTAA ACTTCCTTTA TGTAAAATAA GTCAATATGA TTATGACAAT 13 20 

AAAATAAATC AGCCTTCACA ATTGATTATA ATTTTGCCAA CCAATTAAAT GACTGATTTC 13 80 

GTGTTAGACG CAAAGCTATT TTATTTATAG AAGCGAATCA TTCATATAAA ATTTAACTTT 14 4 0 

AGATATTTTA CCATATTTTC AATAAAATTA TAAGCGTTAA TTATTTATAC ATTGCTTGAC 1500 

TTAAAAAATA CTCTTGCCTC CCCATCTTTA AGGTTAGCAA GAGTAAAATC TTTTTAATTA 156 0 

TTCTTCCATT TCAGTATTTA CAACTTCTTC AATCATGTCC CATTCTTCAT CAGTTTCGAT 1620 

TGGTACTAAC TTACCACCGT CACCTGACTC ATCTGGTT CA TTGATCATTG GTACAAG CTC 16 8 0 

AATCATATCG TCTTCATCTG ATTGAG CACC TTCTTCAGCT AAGATAACAT ACTCTTTTTT 1740 

GAATTCAGGA TGATAAAATT CTAAAACTTT TCGGTATAAA ACTTCATTTC CCTCTTCATC 18 00 

GAATAAAGTT AATAATTCTT CTTCGTTATT AATTTCT AG T TGTGAATCAT GATTATGTTC 18 6 0 

AGTCATAGTA AAATCTCCTT TTAATGTAGT GAATCTAAAT AGCCTTGTAA AATAAATACC 192 0 

GCTGCCATTT TATCAATCAC TTGTTTTCTT TTTTGTCTTG AAACATCTGC TTCTAATAAT 198 0 

GATCGTTCAG CAGCCATTGT GCTTAATCTT TCATCCCACA TCACAATCTC AATAGAAGGA 20 4 0 

TAAGCTTCTA ATAATTTTTC TTTATATGTT AACGAAGCTT CGCCTCGAAA TCCTATTGAA 2100 

TTATTCATGT TTTTAGGTAG TCCTATTACG ACTGTACCCA CATTATGTTT TTTAATAATG 216 0 

TCTACTAATT GGTCAATACC TAATTCATTA TTTTCTTCAT TGATTCGGAG TGTGTCTAAT 222 0 

CCTTGTGCCG TCCAACCCAT TATATCACTA ATTG CAATTC CTACCGTTCT ACTACCGACA 2280 

TCGAGTCCTA AAATTTTATG TTGTAACATA AATTATTTAT TTTGCTCTTT TAAATAGTAA 234 0 

GAAACAAGCT CTTCCATAAT AACATCTCTA TCAATATGAC GAATTTGATT TCTTGCTTCA 24 00 

TTTTGGCGTG GAATATACGC AGGGTCACCT GATAATAAAT AACCTACAAT TTGGTTTACG 24 6 0 

GCATTATATC CTCGTTCATC TAATGTTCGA TAAACATTAT TTAAAACATC TCTTACATCT 2520 

TGCGTTGGAA GTTCTTCATA GTCGAATTTC ATTGTTTTAT CAAAGTTTTC CATTTGCGAC 2580 

ACTCCTTTAA TTACAAATAT AACTCACTAT CATCATACAA TATTATGGCT TTAAATTATA 264 0 

GATTTTTAAT GTAATCTTTA ATAAAGCTTA ATGATTTTGA GATATTTTCA GGTTGTGTAC 2700 

CGCCACCTTG AGCCATATCT GGACGACCGC CACCTTTACC ACCAACGATT GGTGCCATTT 276 0 
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TCGATACTTT ATCATCAACA TTACTTGCAA GAATGATAAT TGTATCTTGT AGTTTAGATT 2 880 

TAAAATCGTC CATTGTCGAG CGAATTG CTT TCGCATTTGG TACATCCACT TCAGTAACCA 2 94 0 

S ATACTTTATA GCCATTGATT TCTTCAACTT GATCTTCAAT ATTACCCATT TTAAGTGATG 3 00 0 

TGATTTCTTT GTCACGTTGC TCTAATTGTT TTAATAATGC TTTTTCTTCA TCTTG TAATT 3 060 

GTGTTAACTT ATCGACTACT TGATCATCAG ATTTCACTTT CAGCTGTGAT TTCATCGTAT 3120 

W TAAATTTCTC TTGAATATCT TCTAAATATA AGAAAGCTGC TTTACCTGTT AATGCTT CAA 318 0 

TACGACGCAC ACCAGCTCCT GTACCTGACT CACTTACTAT TTTGAATAAG CCAATTTCAG 324 0 

AAGTATTGCG GACATGAATA CCACCACATA ATTCAATTGA AAATGGTGCC ATATTTACTA 3 3 00 

is 

CACGCACAAC ATCACCATAT TTTTCACCGA ATAATGCCAT TGCGCCCATT TCTTTAGcTG 3360 

AAG CAATATC CATTTCTTGA ATGTTAACGT CAATACCTTT CCAAATTTCT TCATTTACTA 34 20 

AGCGTTCAAC TTGATCAATT T CATCATTAG TCATTGGACC AAAATGAGAG AAATCAAAAC 34 80 

20 

GTAAACGAT C TGCTTCTACT AGTGAACCAG CTTGGTTAAC ATGATCACCC AGTACTGATT 354 0 

TCAACGCTGC ATGTAATAAA TGTGTTGCAC TATGGTTCTT TTGAATGTCA CGTCGATCAT 3600 

2S TTTGGTTCAC TTCAG CAGAC ACTGTAGCGC CAACATTTAC TTGGCCAAAT TGTACTACTC 36 60 

CTTTATGCAA GTTTTGACCA TTTGGTGCTT TGGTTACTTC ACTAACAGCA ATTTCAAAAT 3720 

TGTCATTATA AACAATACCT GTATCCGCAA CTTGTCCACC ACT GATTG CA TAAAATGGTG 37 80 

30 TTTCCGTTAA CATGAAGTAT ACTGTTTCAC CCGCTTCAAC TTGTGAAACT TCTTCACCAT 384 0 

TGTATAT CAA GTGTGTTAGT GTTGTTTGAG c t GTCGCAGT ATCATAACCA ACAAAAGTAC 390 0 

TTG CAGATGT AATATTTTTC AATACTTCAC TTTGAACTTG CATTGATTGA GAATTTTGAC 3 96 0 

35 GTGCTTGACG TGCACGATCA CGTTGTTGTT GCATTTCTGA CTCGAATGTT GTCATATCAA 402 0 

CTTTCAATCC TGCTTGCACT GCTATTTCTT CAGTTAATTC AATTGGGAAC CCATACGTAT 4080 

CATACAATTT AAATGCATCT TTCCCATTAA TTTCATTTGT TGTCGCTTTA GCTTTTT TA A 414 0 

40 TTAATTCATT TAAAATCGCT AAACCATCTT CTAATGTTTC ATGGAATCGT TCTTCTTCAG 42 00 

ACTTTATAAC ACGCTTAATG AAATCTGCTT TTTCCTTAAC ATTTGGATAA TATGGTTC CA 42 6 0 

TAATGTCTGC AACAATATCA ACAAGTTTGT ACATAAATGG CTCATTGATT CCTAACGTTT 4 32 0 

45 

GACTAAAACG AACGGCACGA CGTAACAATC GACGTAATAC ATACCCTCTA CCTTCATTGG 4380 

CAGGTAATGC ACCATCAGAA ATTGCAAATG CAATCGTACG AATGTGGTCA GCAATTACTT 4 44 0 

5Q TAAATGCCAC ATCTTGTTCG TTGTTTACTA AATATTGTTT ACCTGATACT TTTTCGATTT 4 500 

CATTCATTAT AGGCATAAAT AAATCTGTTT CATAGTTAGT ACGTACATTT TGAGAAACTG 4560 
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TATGATCTTT 
CATTTTCTCC 
GATCATAGAA 
CTTCAATGCG 
CTTCCATATC 
TATCACTCGT 
TTGAGAAGTT 
CAATATCATT 
CACGTCCATC 
CATCATCAAT 
AATCTAGATA 
ATTTACTGTT 
AACTAGTATA 
AGGGACGAAC 
TTTAATTCGA 
AC CAACCAGT 
TCTATTTTAG 
CTCCCATATT 
CTGTTTTTGT 

cttgatcatc 
tttcttcatc 

CTTGACCATT 
TCGTTTTCGC 
GTTTAACAAT 
TACAATAAGC 
CAAAATCCAC 
CAATAACTCC 
CTTTGTCACC 
TAGGGTTTAA 



ATTATGATTG 
ACCTGGATAC 
AATCTCAGTG 
AATAATACGA 
TTCCGGATGA 
TAAAAATTCC 
ACCTAACATT 
TGTACGAATA 
AAAATATTTC 
TGGCACTAAT 
TTTTTGTCTA 
TTTAAATTAC 
AATCAATATC 
GTTATCGCGG 
CTATACAGTT 
ACATCTCTGA 
TTACATTTAC 
AATCATTGGG 
TGAATCAGAC 
TATTGTCGTT 
TTCTGAATTA 
TGTTTTCAAT 
TCTAGTTAAA 
AGGCATGATA 
ATGTGTTAAT 
AACAAGTACA 
TATGTCACCA 
TTTTCTAAAG 
AATATCTTGT 



AATTCACTAA 
ATTTCTTCTG 
TTCGGTCCTG 
CTTTCTTCAA 
ATCGTAACGT 
CAAGCAAATT 
TCAAAGAATG 
G CTTTTTG AG 
TTTAATGTTG 
GGTGCAGAAG 
ATTTCACTCG 
CATTC CATAA 
ATTTTTTATT 
TACCACCCTA 
GTG CATAAAG 
TAAACAAATC 
GCTTGTTGTC 
TCAATTTTAA 
ATAACTTCTT 
TGTGAAGCTC 
AAATAATTTT 
CCAATATCAA 
CCAGTATATA 
ACAATAGGAA 
TCCATCATAT 
TCTTTATTAA 
TTGAATATGT 
ACTACATCAC 
AAAACTTGAT 



ATACTAAGTT 
CCGGATCGTC 
AAGGCCCTTC 
GCCCAATATC 
ACAATTTATC 
CAATCGCTTC 
TATGGTGACG 
AGTTTACAAT 
CTACACCTGA 
GTTCAACCAT 
CTTTTAACTT 
AAATTGATGA 
ATTAAAAAAT 
GTTATAAATG 
TAGCGTTCAC 
aTTAACTACT 
AACGTTCTAT 
ACATTGTAGC 
CACTATCATT 
CTGTATCATT 
TCAACAATGT 
ATGCTTCCGG 
ATATCGGTCT 
ATT CTGAACC 
CTTGTTTCGT 
GGGCATTTTC 
TATCATTTGG 
CAAACTCAAT 
TTAAACGTTT 



C CATACTTC A 
TTGTCCATAT 
ACCAATATCC 
TTTATGCCAA 
TGGCTCCATA 
TTGTTTAAAA 
CGCTGTGAAA 
TCTTGGCTTT 
ATTAATCCAT 
ATGTCCTTTT 
TTTCATCATT 
CACAGATAGT 
AAAAAACGCC 
CAATTCAACA 
TAATGTTTGT 
CATCTTTATA 
AAAGTCATAC 
TTCCGTTAAT 
CGATGACATT 
AgTTGCTGTG 
ACATAATTGT 
ATCACCAAGT 
TTGTAACATT 
TTGTGATTTA 
AAATGTAATT 
TTTCGCCCAA 
CCTATTAACA 
TTCT CGTGTG 
AATACCGGCA 



AGATAGCGTT 
GCTTCTCCGC 
CAG AAGTT A C 
ATGTTGTATG 
CCCATCCATT 
TAATCACCAA 
CCAACATTTT 
TTAGGTGTTt 
AATAATGTAT 
TCAACAAAGA 
TACACATCCT 
CGATTTGCAA 
CATCCTCAAA 
CATTTATCAC 
t GTACTTTTC 
CGAATTTAAT 
GGCGTGATTT 
ACATTTGTAT 
GGCGCTTCTA 
TTTTCCAgCA 
GTTAAACGCG 
AAAACTAAAC 
CTAAAATACT 
TGGATTGATG 
TCATTACCTT 
AAAATACCAA 
AGTTGTAATA 
TCTTTCTTTT 
TTTCCTTTAT 



4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 
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CTACCTTCTC AACAACTGTT GGTATTTGGT TTGCCTGACA GTTAATAAAA CTTCTATCAT 64 8 0 

GAAAACGCTG TGTAATATCA ATTTTCTGAC CCAACTTCAT TCGATGTGCT AATTCTATAA 6 54 0 

5 TGCTTGAACC ATCTTGTTGA CGATATACTT CAGTCAGATT TACTCGTGGT ATAGCTTTCG 6 6 00 

ATTCAATTAA ATCTTTAAAT ACTTGACCAG GACCTACAGA AGGCAATTGG TCCTCATCAC 6660 

CTACAAATAT CAATTGTGCA TCTAAAGGAA CTGCACT TAA AAATTGGTGG AACAACCAAG 6 720 

10 TATCTACCAT AGACATCTCA TCAATGATTA TGAGTCGTGC GTTTATTTCA TTTTCTAATA 6 7 80 

TATCCTCTGG CTTTGTGTCT TGATTCCAAC CTATTAAACG ATGAATCGTC ATTGCTTCTA 6840 

ATCCAGTTGA CTCTTGTAGT CTCTTAGACG CTCTTCCTGT TGGCGCTGCT AATACAACTG 6 900 

15 

GATAATCATC ATTGACATAA TCATCATAAT CTAATGATAA GCCATGAATC TCAGCATATA 6 960 

ATTCAACAAT ACCTTTAATT ACTGTCGTTT TTCCTGTTCC CGGTCCACCG GTTAATAGCA 7 02 0 

TCAC CTTAGA ATTGATAGCC GTTTG CAAAG CTTCTTTTTG TGAAGCTGCA TAGTTCACTT 7080 

20 

GATTCGCATC TTCTATTTCA CCAATATGCA TTTGTAAATC TGACTGTTCA ATTTCTGTAA 7140 

GTTTATTTGT ATGCGTCTTT ATTCTGAATA AGTTTTGAAC ACTTTTGATT TCaGAATAAT 72 00 

2S ACAAACTTGG AATTGCAACT TGTTCaTTGT CAATAATTAG TCGTTTTTCC TCATTTAAGT 72 60 

ATTGCAACAT TTCGTCTAAT TTTTCAGGTT CGATGACCTC TTCATCTTGa TAATTTAATA 7320 

CATCAACCGT TAAATCTATA ACAACATTGA TAGGCAAATA TGTATGTCCC TGTTTAATAC 73 3 0 

30 ATTCTTCTTC TAACGTATAG AGCAACGCAG CTTTTAATCG TTCATTATCG TTATAAGCGA 74 4 0 

TACCAATATT TCTAGCAAGT TGATCTGCTT TATTAAAACC AATACCTTTA ATATCATAAA 75 0 0 

TCAATTGATA TGGATTTCGA TCTAAAATAG TCAGTGTATC GCCGAGATAA AACTGATAAA 7 56 0 

35 TTGCCATTGA AAGTTTAGGA CCAAACCCTA AATCATGTAA ACGAATCATT ATTTTTTCAG 762 0 

ATTCTTGATT TGCTGAAATT TGTTCTGCAA TTTGTTTCTG TTTCTTTTTA GATAATCCCG 76 80 

AAAC TTTTT C TAGCACTGAA TGGTCATCTA ATATATCATT TATCGCATTG TCACCTAATG 774 0 

TATTAACAAT ATTTTGAGCT GTCTTTTTAC CTACACCTTT AAACAAATCA CTAGATAAAT 7 8 00 

AACTTATAAT TGCTTCTTTC GTTTGTGGCA TTTCTTTTTC AAAAGTCTCT GCTTTTAATT 786 0 

GTTTACCATA ACGTGGATGA TCAACAACTT GCCCTTTAAA TGTG TAG ACA TCGCCTTCAA 792 0 

45 

CAATATTCGG AAGAAACCCT ACAACAGTTG GCATTGTATC AAAGTCTTCA TTTGTTTCAA 7980 

TAGTATCTAC TTTAAGCACT GTATAAAAAT TATCACTGTT TTGAAACAAT ATCGCTTCAA 804 0 

50 CAGTACCTTT GATCATTGAA TAAT CAAAT A GTGTAGGGTC TGACATGTTA CTCCTCCTCT 810 0 

TTCATTTTAG TGAATGTTTT CAGCGCATGC TGACTTAATA AGTGTTTAGG GTCGATAGTC 8160 
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AAGCCCAAAT TGTATCTTGC ATCAACATGA TTTTTATCAA TCGTTAATAC ATGTTTAAGT 82 80 

TGAGTTATGG CTTCATTAAA CATTTCTAAT TGACATAATA CAAGACCATA TTGAAATTGA 8340 

5 ACTT CTG CAT CTTTGTCTTT ATCTAGTTCC GCAGCAGTCA TTAAATACGG CAATGCCAAG 84 00 

CTTAAATGAT TCTAACTGAT TAAACGCCAT ACCGATCATA TAATTACAAT CAACTTGTTC 84 6 0 

AATCTCTGTT TGTAATGCTT GTTGATATAA TTTAATAGCT TCTTGATAAC GTTGCTGATT 852 0 

10 

ATAATATACA TTTGCTAGAT TAAAAAATAC GACGCCATTC TTCGGATCTA TTGTnAAAGC 858 0 

TTTTTGGAAA AAACGCTCTG CCTTTyCAAy CyCATTCgCA TCAGCAAGTA CGATmCCaGC 8 64 0 

ATTAATATAA TTTTCAATAA TTGTAGGATT TTCTTCGATA TTTCCGAACA ATG CTTGTAA 8 700 

15 

CGCTTCTTCT ATTTTTCCAT TTTGTATGTA TTGATAAATT GTTTGTTGAT CTAT CATTT A 8760 

CGAACCTCAT TTCTCATCAA TTATAACATC TTGATAAATT GTATGTCTCG AATCACTTAA 8 82 0 

2Q CAACGAATAA AATATAATCT AATATCATCT TCATTCATGA AAAAGCGGGA ATGGAATAGA 8 88 0 

AATGCTTAAG AACCATTAAC GGTTTATTAT GTAATGGTTC TTCCACATTA GCCACCACTA 894 0 

TTATGTACTT AAAAATAAGA ATACATAATT AGATTCATGC ATAGGGAGTG GGACAGAAAT 9000 

25 GATATTTTAA CAAAATTAAA TTCGTTATCC CCAACTGGCA TTGCCTGTAG AATTTCTTTA 9060 

CGAAATTCTC TATGTTGTGG TCCCGCCAAT ATAACATTGT AGAGCCTAGG ACATTGTGAT 912 0 

GTCC CAG ACT CTATCCTCAT GAATTATTCT CATCAAAAAC TGTCTTTCGT CATTTTCAAC 9180 

30 GTTGAAACTT CAAATAAGTA ATTTATTGTT GCCATTGTTT ATACAACATA ATTTAATTGA 9240 

CCTTCATTTT TGAACACATC GTCAATTGTT GCACCACCAA GACACACATC ACCTTGATAA 93 00 

AAAACAACTG CTTGTCCAGG TGTGATTGCT CTTACTGGCT CAGCAAAAGT AACACGTAGg 93 60 

35 CAtGGtCGTT TTCACGTTTC ACAAAAACTT TCGTATCTTT TTGGCGATAT CTAAATTTAG 9420 

CTGtACATTC AAAACCTTGA TCTAAGTCAT TATCTTCTGG ATTTACAAAT GAATAGTCTG 94 80 

AAGCAATTAA GTAATCACTG TATAATGCAT CGTGATGGAA TCCTTGTTCT ACATATAAAA 9540 

40 

CATTATCTTT TAGGTTTTTA CCGACAACAA AC CAAGG ATC GCCATCTCCA CCTATACCTA 9600 

ATCCATGTCT TTGTCCTATT GTGTAATACA TCAAACCACT ATGTTTACCC ATTTTCTTAC 9660 

45 CATCAAGTGT TATCATAT CA CCCGGTTGTG CAGGTAAATA TTGTGATAAA AATGTTTTAA 9720 

AGTTTTTTTC GCCGATAAAA CAAATGCCTG TAGAATCTTT TTTCTTAGCA GTAACAAGTC 9780 

CTTGTTCTTC AGCAATTCGA CGCACTTCAC TCTTTTCGAT GTCGCCAATT GGGaACATCA 9840 

50 CTTTTGAAAG TTGTTGTTGA GATAATTGAT TCAAGAAGTA TGTTTGATCT TTATTATTAT 9900 

CTACACCACG TAACATTTCA ACATGACCAT CTTCATGACG ATGTATG CGT GCGTAATGTC 9 960 

55 
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CTATTATTTT < 



5 TCTGGATTTG GAGTACGACC TTTTTTGTAT T CATCTAAG A 10080 

! CAATATTCTT TTTCAAAATT AACAGCGTAA TACGGAATGC 10 14 0 

^ ATAACATCGT TGTAATCTTC AGTTGCAGTA CATACGCCAT 10 200 

; -pTTTTCATAA ATATGCCAAT GACATCATAA CCTTGTTCTT 10260 

^ GAACTATCTA CACCGCCTGA CATACCAACG ACAACACGTA 103 20 

7 GACTCCTCCT TAAATTTAAA ATATATTTTA TGAATTTCAG 103 80 

I TTTTCAGTAG TCAATTCGTT AAAACTAAAT CGAATCGAAT 10440 

: TCGAACATTG CATCTAAAAC ATGCGACGGT TGTGTAGAGC 10500 

V GACGACACAT AGATTTGTGC CATATCCAAC AATGTTAACA 10560 

; GGAAAATATA GATTTACAAT ATGGCCTGTA GCATCCGTCA 10620 

7 GGAATCGCTC TTTCTTGTAA TTTAACTAAA AATTGTTCTT 106 8 0 

i TTGTTATCGT CTCGATTCTT TTCTGCTAAT TGTAATGCTT 10740 

: GCAAGATTTT CAGTGCCTGC ACGGCGTTTC AATTCTTGTT 10 800 

i TCTAGTGTAA CATGGTCTTT AACTAGTAAT GCACCGACAC 10 860 

i TGAGCAGTAA TACTCATTGC GTCGATCTCA AATTCGT CAA 10920 

i ATTGCTTGAA CCGCATCAAC ATGGAAATAT GCATTTGTCT 10 9 80 

i TCATAAATTT GTtGCACTGT GCCAaCTTCA TTATTTACAA 11040 

: GTCTTATCTG tAATTGTTTC TTCAAGTTGA TCTAAAT CAA 11100 

i TCTAGATATG TTACATCAAA ACCTTCTCGC TCTAATTGTT 11160 

k TGATGTTCAA TCTTCGATGT GATAATGTGA TTACCCAATT 11220 

; CCTTTAATTG CCGTATTATT CGATTCTGTT GCGCCACTCG 112 80 

i TCTGCACCAA GTAATTGTGC AATTTGACGT CTTGACTCAT 1134 0 

' CTTCCCTTAG CATGTATTGA TGATGGATTA CCATAATGCG 114 00 

: GCATCTACTA CTTCAGGTTT TACTGGTGTG GTCGCAGCAT 114 60 

; TTTGGACACT CCTCACAATT TTATCAATGT TCCAATAATA 1152 0 

? CTACTTTTCT GTTTAACTTT ATTTATAATG TTTTTAATTA 115 80 

: ATGCTTTTCG ATAGGCTTTT TTAAGTTTAT CG CTTT ATTC 1164 0 

7 AGTATTTGCA GATATTTTTT TATTTGTAAA ATGTAACGTA 11700 

: AATTTAATAT TTATCTGGTT ATTCGATTGG TATACTTCTT 11760 
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GTCCCTATTC 


GAGAAGGTGA 


AGATGAACAA 


ACAGCAATTA 


ATAATATGGT 


TAATCTCGCA 


11880 




CAACATTTAG 


ACGAATTATC 


ATATGAAAGA 


TATTGGATTG 


CTGAACACCA 


TAACGCTCCC 


11940 


5 


AACCTAGTAA 


GTTCAGCAAC 


TGCTTTATTA ATTCAACATA CGTTAGAACA TACGAAACAC 


12000 




ATACGTGTAG 


GTTCTGGAGG 


CATCATGTTA 


CCTAATCATG 


CTCCATTAAT 


CGTTGCGGAA 


12060 




CAATTTGGCA 


CGATGGCAAC 


ATTATTTCCA 


AATCGTGTCG 


ATTTAGGATT 


AGGACGTGCA 


12120 




CCTGGAACAG 


ATATGATGAC 


CG c AAGTGCA 


TTAAGACGAG 


ATCAACATGA 


TGGTGTTTAT 


12180 




AAATTTCCAG 


AAGAGGTTTC 


ATTATTACAA 


CAATATTTCG 


GCCCTGCTCA 


CCAACAAGCA 


12240 


15 


TATGTTCGTG 


CTTATCCAGC 


AGTAGGTAAA 


AATGTGCCTT 


TATACATTCT 


TGGTTCTTCA 


12300 


ACAGATTCTG 


CACATTTAGC 


TGCTCGCAAA 


GGGCTTCCAT 


ATGTGTTCGC 


TGGACATTTT 


12360 




GCACCTCAAC 


AAATGAAAGA 


AGCTATCGAA 


ATTTACAAAA 


CGTTATTTGA 


ACCTTCTGAT 


12420 


20 


GTATTAGACG 


AACCTTATGT 


TATTGTATGT 


TTAAATACAA 


TCGTTGCTGA 


AAATGATGAC 


12480 


GAAGCACAAT 


ATTTAGCTTC 


ATCTATGGCA 


CAAGTAATGG 


TTAGTATCAC 


TCGTGGCAGA 


12540 




ATGCAGCCCG 


TTCAACCGCC 


AACACATGAA 


CTACAAAATA 


TATTAACGCC 


GAGAGAATAC 


12600 


25 


GCGATGGCTA 


TGGAAAGACA 


GAAAATATCA TTAATAGGTT 


CAGAAAATAC 


TGTTCAACAA 


12660 




AAAATTCAAG 


ATTTTATGGA 


AACTTATGGT 


GAAGTCAACG 


AAATTATGGC 


AATAAGTTAT 


12720 




ATTTATGATA 


AAGATATGCA 


ATTAGACTCT 


TATCGTCGGT 


TCAAGAATGT 


TATAAATCAG 


12780 


30 


ATAAATGAAA 


AAAACACTTT 


ATAATGTGAT 


AAATAAACTA 


AGTGAAAGTA 


TGTATCCATA 


12840 




ATATTAATAA 


AAATATACAG 


TAACAGCATT 


TTGAATGAAA 


GATGTCTTTA 


TTGTTCAATC 


12900 




ATTTATTTTA 


GTAATGATTC 


AAATTCACTT 


AAAATyCTAA t GCAAATATG AAAGCGCCCC 


12960 




TTCAcTTTAC 


ACTGTGTAAG 


TGTTTATTTG 


ATGGGGCGCT 


TTCAAAATAT 


TGAAAAGCAT 


13020 




ATCCfiAAATT 


TAAAGAAATT 


TATTT CTCTT 


TATCTTCATT 


TTCTTTTTTC 


TCTTCGTTAT 


13080 




TCGA^CCTGT ATATTCATTT ATCTTATCTT 


TTACATTTTT 


AACTTGTTCA 


TTATCGCTAT 


13140 


40 


TTTTAAATTT 


TTCTACGCGT 


CTTTAGCTTT 


ATCCATAAAA 


CTCATATTAA 


TCGCTCCTCT 


13200 




TATATTTGAT 


TAGTTTAATT 


GAACTTATTT 


TTTAAGTTTA 


TCAATTGCAT 


CAGTTATTTT 


13260 


45 


GTTTTTAGCA 


TTTTCAACAA 


CTTCTTTTGC 


TTTaCCAGTC 


GCTTTATCTT 


GCTGACCTTC 


13320 




TTTTTCTAAT 


TCTTTGTTAT 


CAGTAACGTT ACCTACTGTT 


TCTTTAACAT 


TTCCTTTAAA 


13380 




TTGAT CGAAC 


TtACTTTCGT 


CTG CCATAGT 


GAAACCTCCT 


TGGATGTATA 


TATTTATATA 


13440 


50 


CCACTAAGGA GGTTCGCTmm mCAyymyAAT ATGAAGTTTT 


TATGTTATAG TATAGTATTT 


13500 




ATACGATTAA 


ATATAAAACA 


TGTATCCGTC 


TAAATCTTCA 


CTTGTATCTA 


CATATTCCGC 


13560 
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TAGTTGTTTT TGCGCAGGTG GTTCTGATTC AATACTTTCA ACAAATGTAA TTGGACCTTC 13 680 
TAACAGTCTT ATAATATCCC CTGCTGAGAT TTCTT 13 715 

(2) INFORMATION FOR SEQ ID NO: 196: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 873 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 196: 



AAATCCATAA 


TGTCATGATA 


ATCTGCATAT 


GCTTCATATA 


ATTCAATCAT 


TGTGAATTCA 


60 


GGGTTATGTC 


TAGTTGATAC 


ACCTTCATTA 


CGGAATACTC 


TACCAATTTC 


ATATACTTTT 


120 


TCAAGTCCAC 


CGACAATTAm 


ACGTTTTAAA 


TGCAACyCAA TAGCAATACG 


CATGTATAaC 


180 


GTTGCATCTA 


ATGCATTATG 


ATGTGTTACA 


AATGGTCTAG 


CAGCTGCTCC 


ACCAGCAATT 


240 


TGGTGCATCA 


TAGGTGTTTC 


TACTT CCAAG 


AAACCTTTAT 


TATTTAAATA 


ATTACGCATT 


300 


TCTTGAATGA 


TTTTACTACG 


ATTAATAAAT 


GTACGAGTGC 


TATCTTCGTT 


CGTAATTAAA 


360 


TCTAAATATC 


TTTGACGATA 


tCTCTGTTCA 


ATATCCTGTA 


AACCGTGGAA 


TTTATCCGGT 


420 


AATGGTCGCA 


ATGATTTAGT 


TAGTAGCGTG 


AATTTCTTCG 


CTTTAACCGA 


TAATTCGCCA 


480 


GTATTTGTTT 


TGAACATTAC 


ACCTTCAACA 


CCAACGATAT 


CGCCTAAATC 


AGCATTTTTC 


540 


CAT AAAT C AA 


ATTCGTCATC 


GCCAACTTGA 


TCTTTACGAA 


CGTAAATTTG 


AATTTGTCCA 


600 


GCTAAGTCCT 


GAACGTGTGC 


AAATCCTGCT 


TTACCTTTAC 


CACGCTTAGT 


CATTAATCGT 


660 


CCAGCTATAG 


CGA CATGACT 


ATCCGCTTCT 


TTTTCTACCA 


ATTCTTCTTT 


AGAATACTGG 


720 


TCCeACTCTT 


CTTTCAAATC 


ACTAGATAAA 


CCTGAACGGT 


CAAATTTAGA 


ACCAAACGGG 


780 


TCTATACCAA 


GAT CAT ATAA 


TTCTTGTAAT 


TtTTGACGTC 


GAACCAACAT 


TTGGTCATTC 


340 


ATTTCTTCTG 


ACATAACTtT 


CTCTCCTTTA 


ACT 






873 



(2) INFORMATION FOR SEQ ID NO: 197: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

50 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 197: 
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ACCATAATAT GAATGGCTTC AGGATCAAAA TAAAGACCAA CTTCACTGCC TACTTCAGCT 12 0 

TTTTTAGTCG TTTGTATTAC CCATTCATAA CCTTTATTGT CTATACAACA TATTTCATAG 180 

TGGACCCCTC TAAATAACAT AGAATCAACA GTTGCTTTAA ATAATCCTTC TTCAGCTTTG 24 0 

ATTAATGATA TATCTTCTGG TCGAATAACG ACTTCTACTT TTTTATTTTC AGGAATACCC 300 

ATATCGACAC ATTCGAAATC TTGCCCATAA ATATTCACGA CATAATCTCT AACCATGCGC 360 

CCTTCAACAA TATTAGATTC TCCAATAAAA TCAGCTACAA ATCGATTCAC TGGTTCGTCA 42 0 

TaTATATCTG TTGGTGTGCC AAATTGTTGA AT 4 52 
(2) INFORMATION FOR SEQ ID NO: 198: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2308 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 198: 

TAGGTTGGGT TCTAACATAC GATAAAGCTC AACAAATCAA CACAGCTTTC TTTGTAAAAT 6 0 

TGTTTAATAC TGCATTAGCA GAACGTGATT ATTATTTTAA TATAGATGGA ACAAATGCTT 12 0 

TTAGATTATT TAATGCTGAA GGTGATGGTG TTGGGGGATT AACAATCGAC AATTACGATG 180 

GTCATTTGTT GATTCAATGG TACTCAAAAG GTATTTATAA ATTTAAATAT GCCATTCTTG 24 0 

AAGCGGTTAG AAAAGTATTT GATTATAAAT CTATTTACGA AAAAGTAAGA TTTAAAGACA 30 0 

GCGAATATAG TGGTGGTTTT GTTGAAGGAG ATGCACCTGa GTTTCCAATT GTTATCGAAG 36 0 

AAAACTTCAC ATTTTATAAT GTAGACCTTG AAGATGGTTT GATGACAGGT ATCTTTTTAG 42 0 

ATCSAAAAGA AGTGCGCAAG AaATTAAGGG ATCAATATGC CAAAGAACGC CATGTTTTAA 4 80 

ACTTATTTAG TTATACAGGT GCTTTTTCTG CAATAGCAGC AAGTGAGG CA TCTTCAACAA 54 0 

CAAGTGTAGA TTTGGCTAAT CGTTCTCGTA GTTTAACTGA AGAAAATTTT GGATTAAATG 6 00 

CTATTGATCC TAAATCCCAA TATATTTATG TCATGGACAC TTTTGATTTC TATAAATATG 66 0 

CTG CACGACA TGGACATAGT TATGACACGA TCGTGATTGA TCCACCTAGC TTTGCGCGTA 720 

ACAAAAAACG TACATTTTCA GTGCAAAAAG ATTATGACAA ATTAATTAAT GGCGCCTTAA 78 0 

ATATCTTATC ATCTGAAGGA ACATTATTGT TATGTACAAA CGCAAGTGTA TATCCATTAA 84 0 

AGCAATTTAA AAATACTATT AAAAAGACGC TTGAAGAGAG TGGCGTTGAT TATGAATTAA 9 00 

CTGAAGTTAT GGGATTACCA AAAGATTTTA AAACGCATCC ACATTATAAG CCATCTAAAT 9 60 
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TATTGAGAAA AAGAAGGGTG ATAATATTAT GGGATTCAAA AACAATTTAA CATCAAATTT 1080 

AACAAATAAA ATCGGTAATT CAGTCTTTAA AATAGAAAAT GTTGACGGAA AAGGTGCAAT 1140 

S GCCAACGACG ATTCAAGAAT TGAGAGAAAG ACGACAACGT GCTGAAGCAA TTGTAAAGAG 1200 

AAAGTCTTTA ATGTCATCAA CAATGAGCGT TGTTCCAATT CCGGGTTTAG ATTTTGGTGT 1260 

TGATTTAAAA TTAATGAAAG ATATTATCGA AGATGTTAAT AAAATTTATG GTTTAGATCA 13 20 

10 

TAAGCAAGTT AATAGCCTTG GGGATGATGT GAAAGAAAGA ATTATGTCTG CAGCAGCAAT 1380 

TCAAGGTAGT CAATTTATTG GTAAAAGAAT TTCAAATGCA TTTTTAAAAA TTGTAATTA G 14 4 0 

AGATGTAGCT AAACGTACTG CTGCAAAACa AACAAAATGG TTTCCTGTTG TAGGACAAGC 15 00 

15 

TGTGTCTGCA TCTATTAGTT ACTATTTTAT GAATAAAATT GGAAAAGATC ACATTCAAAA 1560 

ATGCGAAAAT GTTATTAAAA ATGTCATGTA GGTGCTATAA TAGTTTTGCA ATTTGCAAAT 1620 

20 TTTACTGAAA CCGGTTTTAA ACGAATTGAA TTTAAAGcAT GGTTTTGGTA AAGTTAATGT 16 80 

ATAAAACTAA GTTAGyATTG TAATAATATk GAAGATTCTA ACTATACGAA GGAGAAATGT 174 0 

AATTATGGAA CAAAATTCAT ATGTAATCAT CGACGAGAmT GGTATTCACG CTAGACCAGC 1800 

25 AACAATGTTA GTACAAACAG CTTCAAAATT CGATTCTGAT ATTCAATTAG AATATAACGG 1860 

TAAGAAAGTA AACTTAAAAT CAATCATGGG TGTTATGAGC CTTGGTGTTG GTAAAGATGC 1920 

TGAAATTACA ATTTATGCTG ACGGTAGTGA TGAATCTGAC GCCATTCAAG CAATCAGTGA 19 8 0 

30 CGTCTTATCA AAAGAAGGAT TGACTAAATA ATCATGTCTA AATTAATTAA AGGTATTGCC 2 04 0 

GCATCTGATG GTGTCGCAAT TGCTAAAGCT TATTTATTAG TTGAGC CAGA CTTAACATTC 2100 

GACAAAAATG AAAAAGTCAC TGATGTTGAA GGAGAAGTTG CAAAGTTCAA TAGCGCTATC 2160 

35 

GAAGCTTCTA AAGTTGAGTT AACTAAAATT AGAAATAATG CAGAGGTTCA ACTAGGTGCT 222 0 

GATAAAGCTG CTATCTTTGA TGCAcaTTGG GGGGTGGTAG ATGAC CCTGA ATTAATTCAA 22 8 0 

CCAATCCAAG ATAAGATTAA AAATGAAA 23 08 

40 

(2) INFORMATION FOR SEQ ID NO: 19 9: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5559 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

SO (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 199: 

AAGTAATAAA TCGTCTCATT TGGCAACTGA CGCATAATTT CTTTAG CTAC TGTCAAACCT 60 
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TTTAATTTTT AGTTTATCAT AACTAAGCAT TGGATTTTAG TATTATGCAC TGTGTTTACC 180 

ATTTTTGTCA TTATAATATT TATTTTAAAT CAGCCCACTA TCATATTGTC ATGTAATCTG 240 

CTTATTAAAA AAATCCCTTC CAAGTTATTG TGTATCTCCA TTCAATTTAA TTTTGAAAGG 3 00 

AACATAACwT TTTAACTCAA AAGGGATTAA TTTnTAnTCT ACTTCATGGT CTGAACCAAA 3 60 

GAATGATTTA AACATGTGGA ATGTTGTTTC TCTGTTCATT GCTG CAATGG ATGTTGTTAA 4 20 

TGGAATACCT TTAGGG CAAG CATTAACACA GTTTTGTGAA TTACCACACT GCTGTAAGCC 4 80 

ACCAGTACCC ATTAATGCAT TTAAACGTTC ATCTTTAGTC ATAGATCCTG TTGGGTGCAA 540 

ATTAAACAAA CGAACTTGCG AGATTGCTTG TGCACCAACG AaTTTATTAT TTTCAGTAAC 600 

ATTAGGACAA ACCTCTAAAC ATACACCACA TGTCATACAT TTAGATAATT CATAAGCTGT 6 60 

TTGACGTTTT TTCTCTGGCA TACGTGGTCC CGGACCTAAA TCATACGTTC CATCAATTGG 720 

GATCCATGCT TTCATACGTT TTAAGTTATC GAACATTCTA GAACGATCAA CTTGTAAGTC 78 0 

ACGGATAACT GGGAAAGTAT TCATTGGCTC TAAACGAATA GGTTGTTCTA ATTGATCAAC 840 

AATCGCAGAA CAAGATTGTC TTGCACGACC ATTGATAACC ATAGAACATG CTCCACATAC 9 00 

TTCTTCTAAG CAGTTCATAT CCCAGACAAC AGGTGTTGTT TTTTCACCTT TAATATTAAC 960 

TGGGTTACGT CTAATTTCCA TTAAACAAGC AATGACGTTT AAATTTTCAC GATATGGAAT 102 0 

TTCAAATGTT TCTT CATAAG GCTTAGAATC ACTTGTATCT TGTCGTTTAA TAATTAATTT 108 0 

TACTGTTTTT TGTTTCGGTT TAGATTGTGT TTCATGTTGT GGAGTGTTTT TCACTGATTG 114 0 

TTCAGTCATT ATTTTTTACC CCCTTTAGAC TTACTTGTGT AATCACGTTT ACGAGGTGGT 12 00 

ATTAAACT CA CATCGACGTC ATCATAAGTA AACTGCGGTT TTTCAAATGC GCCTTGGAAT 126 0 

GAG GC CATTG TCGTTTTTAA CCACTCTTCA TCATTACGCT CTGGGAATTC TGGTTTATAA 132 0 

TGGGCACCGC GTGATTCGTT ACGGTTATAT GCACCAATCG TAATAACACG TGCAAGTACT 13 8 0 

AACATGTTCC ATAGTTGACG GGTAAAGAAT ACCGCTTGGT TACTCCAAGT TTGAGTATCT 144 0 

TCCATATCAA TATCTTCATA ACGTTTCATC AATTCAACAA TCTTTTTATC TGTTTCTAAC 15 00 

AGTTTTTCAT TTTCACGAAC AACAGTTACA TTTGCTGTCA TAATTTCACC AAGTTCACGG 15 6 0 

TGTAATTTAT ATGCATTTTC TGTACCGCGC ATAGCTAATA ATTTATCAAA ACGTTCTTGC 16 2 0 

TCTTCAGCTT TACGCTTTTC AAAAATACTT TCGTCCATAT CAGTATATGA TCGATCAATA 1680 

TTTGAAATAT AATCAATCGC GTTTGGACCT GCTACTGTAC CACCATAAAT CGCTGATAAC 174 0 

AATGAATTGG CACCTAAGCG GTTACCACCA TGTTGAGAGA AGTCACATTC TCCAGCTGCA 18 00 

AATAACCCTT TAATATTTGT CATTTGATCA TAATCTACAT ATAGACCACC CATTGAATAG 1860 
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TAAATCTCAA TGATACCACC TAGTTTTACA TCTAACTCAT GTGGATCTTT ATGTGACAAA 19 8 0 

TCAAGATATA CCATGTTTTC GCCATTTATA CCTAATTTTT GGTTAATACA TACATCGAAA 204 0 

5 ATTTCACGCG TTGCGATATC ACGAGGTACT AAGTTACCAT AATCAGGATA TTTCTCTTCT 210 0 

AAGAAGTACC AAGGCTTACC ATCTTTATAT GTCCAAATTC GTCCACCTTC ACCACGTGCT 216 0 

GATTCACTCA TTAGTCGCAG TTTATCATCA CCAGGGATTG CAGTAGGATG AATTTGAATG 222 0 

10 AACTCACCAT TAGCATAAAT AGCGCCTTGT TGGTAAACAA TGGAAGCCGC TGATCCTGTA 22 8 0 

TTAATCATTG AGTTTGTTGT TTTACCGAAA ATAATACCAG GGCCACCCGT TGCCATAATA 234 0 

ACTGCATCTG AACCAAATGT TTCAATCTCA GCAGTTGTCA TATTTTGTGC AnCGATACCT 24 00 

15 

CTTGCACTAT CATCGTCACC TTTAACTATG CCAAGGAATT CCCATCCTTC ATACTTCGTA 24 60 

ACTAATCCAT CTACTTCATA TGCACGAACT TGTTCATCCA ATGCATATAA TAATTGTTGT 2520 

CCAGTTGTTG CCCCTGCATA TGCTGTTCTG TGATGTAATG TACCACCGAA ACGTCTAAAA 2580 

20 

TCTAATAGAC CTTCATTTGT TCTATTGAAC ATTACGCCCA TACGGTCTAA TAAATGAATA 2640 

ATTTTAGGTG CTGCCTCTGT CATCGCTTTA ACAGGTGGTT GGTTTGCAAG GAAATCGCCA 2700 

2S CCATACACTG TATCATCAAA GTGAATCCAA GGAGAATCGC CTTCCCCTTT AGTATTGACC 2760 

GCACCATTAA TGCCACCTTG GGCACAAACA GAGTGCGAAC GCTTTACTGG TACAACTGAG 2820 

AACAAATCTA CATGTGCACC TTTTTCTGCC GCTTTAATTG TTGACATTAA GCCCGCTAGG 2880 

30 CCACCTCCGA CAACAATAAG ATGTTTCTCT GCCATAAAAA TTTCACTCCC CTAAATTTTC 2 940 

AATCTATATT TGTTAAATGC GATGTATTAC ATAAAGGCAA TAATTGCAGT AACACCAATA 3000 

TACGAAATAA CTAAAAATAC GATTAA TGAA ACCCATGTAA ATACTCGTTG TGATTTTGGA 3 060 

35 GATTGAAGTC CACCCCAAGT AACTAAGAAT GACCATAAGC CATTTGCAAA GTGGAACACA 3120 

ACAGEAATAA TACAAATAAT ATAAAATATT GCCCATCCAG GATGTTGCAA TGTTTCGTGC 3180 

ATTAAATCGT AATTCACTTC TTTGCCGTAA AATGCTTTTT GTAAACGTGT TTGCCATAAA 3240 

40 TGGATACCAA TAAAGATAAA TGTTAAGATA CCACTCACTC TTTGGAAGAA GAACATC CAG 3 3 00 

TTTCTAAAAA TCGAGTAATG TCCAACATTT TCTTTTGCTG TAAATGCAAT GTGTATACCA 3 360 

AACAAACCGT GATATAACAA CGGAATGTAT ATAAATAAAA ATTCTACAAT AATTAGAAAT 3420 

GGTAATGATT CCATAAAGTT AGATGCCTTA TTAAACGCTT CAGCACCTTG TGTTGCTTGG 3480 

TGATTCACTA ATAAATGAAC GACCAAAAAT GCACCTATTG GGATAATACC TAATAACGAG 3 540 

so TGAATACGTC TTAGATAAAA TTCATTTTTT GATTGAGCCA AAAGGAGTCC CCCCTGTGAA 3 6 00 

CGAATATTTA ATTTATTGAG CTATTTATAT TAAACGTACG CTTAACCCCC TAAAGTGATA 3 660 
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CGATCACCAA ACTGCATGTC GAACAATGTA ACATTTGGAT TCGATATTTA AAATTGCTTG 3 780 

TGATGATAAA CTTTCTCATT TAGAAAACGC TTCCACGTAC ATTCAAAAAA ATAACTTTGT 3 84 0 

S TAACCATATT GTAACATTAT TT CAT AT ATT TTGGGGCATG AGAATGATTC TCACGCCCAG 3 90 0 

TAATTTATTT ATGCAATTGT TCATGTAGGT TCTTTGCGAC GTTTTCAGGA ATACCTATAT 3 960 

TTTTAAAATC TTCAAGTGTA GCTTCCTTCA TTTTCTTGAT TGAACCGAAT GAACGCAATA 4 020 

10 ATAATGTTTT ACGTTTGTTA CCGATAC CAT CTATATCATC AAGTATTGAT TTCAAGCCTG 4 080 

TCTTTTGACG TGTTTGTCTA TGAAATGTGA TTGCGAATCT GTGAACCTCA TCTTGGATAC 4140 

GGTGCAACAA ATAAAATGCC TGGCTATTTT TCTTCAGTGG TACAATTTCT GCACTAGCGC 4200 

15 

CATATAATAA TTCAGATGTT TGGTGTTTAT CATTTTTCTG CAAACCTGCA ACAGGGATAT 4260 

CAAGACCTAA TTCGTTTTGT AGCACAT CAA TAACCCCGTT CATATGTCCT TTACCACCAT 43 20 

^ CTACTATTAT TAAATCAGGT AATGGTAATC CTTCGTTTAA AACGCGAGAA TATCGTCGTC 43 80 

TTACTACTTC TCTCATTGAT TTGTAATCAT CTGGACCTTT AACCGTTTTG ATTTTATACT 444 0 

TTCTATAATT TTTCTTATCT GGTTTACCGT CGACAAATGT AACCATTGCT GACACTGGAT 45 0 0 

2S CCACACCTTG AATATTAGAA TTAT CGAATG CTTCAATTCT AATTGGTGTT TGAATTCCCA 45 60 

TTTGTGTTCC AAGTTCTTCA AT AG CTTT AA TCGTTCTGGA CTCATCACGT GATATTAATT 462 0 

CAAATTTATT ATTTAAGGAT ACTTTAGCGT TATGTGCAGC TAGGTCAACC ATATCTTTTT 46 8 0 

30 TGGGACCTCG CGCGGGTTGA ACGATTTTAG TGTCCACAAC AGATTGAATC ATTTCTTTAT 474 0 

CCAAATTACG TGGTACATGA ACTTCCTTAG GTAAAATATG TTGGTTTAAG CTATAAAATT 4 80 0 

GTCCAATAAA TGTATAAAAT TCTTCTTcTT CTGTTTGCTG TAATGGAATC ATCGTTGTAT 4 860 

35 CTCGCTTTAT CATATTACCT TGTCGTATAA AGAAAACTTG GATACACATC CATCCTTTAT 4 920 

CAACACTATA ACCAAAGACA TCACGAATCG TTTTATCTGA TGACATAATT TTTTGTTTGT 4980 

TTGTCAGATT TTGAATATGT TGAATTAAAT CTCTATATTC TTTAGCCCGT TCAAAATCAA 5040 

GTGATTCACT TGCAGTTAAC ATTCGCTCTT CTAAACTTTT TAAAATTGTT TTGTCTTCCC 5100 

CATTCAGAAA ATCAGTAATT TC CTTCGTCA TTTGTGCGTA TTTAC TCAAA TCAACGTCAT 5160 

^ ATACACATGG TCCTAAACAT TGTCCAATAT GGTAATAAAG ACATAATTTA TCTGGCATCT 5220 

TATCACATTT GCGATATGGA TATATTCTGT CTAATAACTT TTTAGTTTCT TGAG CAGAAT 5280 

ATGCATTCGG ATACGGTCCG AAATATTTGC CAGTACCTTG TTTTACAGTT CTCGTCACTA 534 0 

so GTAGTCTAGG ATATTTCTCC TTCGTAATTT TAATAAATGG ATAACTTTTA TCATCCTTTA 54 00 

ATAATATATT ATATCTTGGT TGATATTGTT TAATCAGATT CAATTCCAGT AAAAGTGATT 5460 
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TTTTAGCATC ATGAGCACCC GTAAAATATG ATCGCAATC 55 5 9 
(2) INFORMATION FOR SEQ ID NO: 200: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 5 94 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

w 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 200: 

AAAT CAATCG AGTGGCATGT CAAGGTCATA TCAATATTTT AGAATCTGCG ACTATGAGAG 60 

15 

AGGAAATAAA TGAAATTGCG CGACGTATCA TCGTTGATAT TCGTGATAAG CAATTACGAT 120 

ATCAAGATAT TGCTATTTTA TATCGTGATG AATCTTATGC TTATTTATTT GATTCCATAT 180 

20 TACCGCTTTA TAATATT CCT TATAATATTG ATACAAAGCG TTCGATGACA CATCATCCGG 24 0 

TCATGGAAAT GATTCGTTCA TTGATTGAAG TTATTCAATC TAATTGGCAA GTGAAT C CAA 3 00 

TGCTACGCTT ATTGAAGACT GATGTGTTAA CGGCATCATA TCTAAAAAGT GCATACTTAG 3 60 

25 TTGATTTACT TGAAAATTTT GTACTTGAAC GTGGTATATA CGGTAAACGT TGGTTAGATG 4 20 

ATGAGCTATT TAATGTCGAA CATTTTAGCA AAATGGGGCG TAAAGCGCAT AAACTGACCG 4 80 

AAGATGAACG TAACACATTT GAACAAGTCG TTAAGTTAAA GAAAGATGTC ATTGATAAAA 54 0 

30 TTTTACATTT TGAAAAGCAA ATGTCACAAG CGGAAACTGT AAAAGATTTT GCAACTGCTT 600 

TTTATGAAAG TATGGAATAT TTCGAACTGC CAAATCAATT GATGACAGAG CGAGATGAAC 660 

TTGATTTAAA TGGTAATCAT GAAAAGGCGG AGGAAATTGA TCAAATATGG AATGGCTTAA 72 0 

35 

TTCAAATCCT TGATGACTTA GTTCTAGTAT TTGGAGATGA ACCAATGTCG ATGGAACGTT 780 

TCTTAGAAGT ATTTGATATT GG TTTAGAAC AATTAGAATT TGTTATGATT CCGCAAACAT 84 0 

TGGACCAAGT AAGTATTGGT ACGATGGATT TGGCTAAAGT CGATAATAAG CAACATGTTT 9 00 

40 

ACTTAGTAGG TATGAATGAT GGAAC GATGC CACAACCAGT AmTGCGTCAA GCTTGATTAC 960 

AGATGAAGAA AAGAAATACT TTGAACAGCA GGCTAATGTC GAGTTAAGTC CAACATCAGA 1020 

45 TATTTTACAG ATGGATGAAG CATTTGTTTG TTATGTTGCT ATGACTAGAG CTAAGGGAGA 10 80 

TGTTACATTT TCTTACAGTC TAATGGGATC AAGTGGTGAT GATAAGGAGA TCAGCCCATT 1140 

TTTAAATCAA ATTCAATCAT TGTTCAACCA ATTGGAAATT ACTAACATTC CTCAATACCA 1200 

50 TGAAGTTAAC CCATTGTCAC TAATGCAACA TGCTAAGCAA ACCAAAATTA CATTATTTGA 1260 

AGCATTGCGT GCTTGGTTAT ATGATGAAAT TGTGGCTGAT AGTTGGTTAG ATGCTTATCA 1320 

£5 



911 



EP 0 786 519 A2 

GTTTGACAAT GAAACTGTAA AATTAGGTGA AACGTTGTCT AAAGATTTAT ATGGTAAGGA 144 0 

AATCAATGCC AGTGTATCCC GTTTTGAAGG TTATCAACAA TGCCCATTTA AACACTATGC 15 00 

5 GTCACATGGT CTGAAACTAA ATGAGCGAAC GAAGTATGAA CTTCAAAACT TTGATTTAGG 156 0 

TG ATATTTT C CATTCTGTTT TAAAATATAT ATCTGAACGT ATTAATGGCG ATTTTAAACA 162 0 

ATTAGACCTG AAAAAAATAA GACAATTAAC GAATGAAGCA TTGGAAGAAA TTTTACCTAA 16 8 0 

10 

AGTTCAGTTT AATTTATTAA ATTCTTCAGC TTACTATCGT TATTTATCAA GACGCATTGG 174 0 

CGCTATTGTA GAAACAACAC TAAGCGCATT AAAATATCAA GGCACGTATT CAAAGTTTAT 18 00 

GCCAAAACAT TTTGAGACAA GTTTTAGAAG GAAACCAAGA ACAAATGACG AATTAATTGC 1860 

IS 

ACAAACATTA ACGACAACTC AAGGTATTCC AATTAATATT AGAGGGCAAA TTGACCGTAT 1920 

CGATACGTAT ACAAAGAATG ATACAAGTTT TGTTAATATC ATTGACTATA AATCCTCTGA 1980 

2Q AGGTAGTGCG ACACTTGATT TAACGAAAGT ATATTATGGT ATGCAAATGC AAATGATGAC 2 04 0 

ATACATGGAT ATCGTTTTAC AAAATAAACA ACGCCTTGGA TTAACAGATA TTGTGAAcCA 2100 

GGTGGaTTAT TATACTTCCA TGTACATGAA CCTAGAATTA AATTTAAATC ATGGTCTGAT 2160 

25 ATTGATGAAG ATAAACTAGA ACAAGATTTA ATTAAAAAGT TTAAGTTGAG TGGTTTAGTT 222 0 

AATGCAGACC AAACTGTTAT TGATG CATTG GATATTCGTT TAGAACCTAA ATTCACTTCA 22 8 0 

GATATTGTAC CAGTTGGTTT GAATAAAGAT GGCTCTTTGA GTAAACGAGG CAGCCAAGTG 23 4 0 

30 GCAGATGAAG CAACGATTTA TAAATTCATC CAACATAACA AAGAGAATTT TATAGAAACA 24 0 0 

GCTTCAAATA TTATGGATGG ACATACTGAA GTTGCACCAT TAAAGTACAA ACAAAAATTG 24 60 

CCATGTGCTT TTTGTAGTTA TCAATCGGTA TGTCATGTAG ATGGCATGAT TGATAGTAAG 2520 

35 

CGATATCGAA CTGTAGATGA AACAATAAAT CCAATTGAAG CAATTCAAAA TATTAACATT 2580 

AATGATGAAT TTGGGGGTGA G CAATAGATG ACAATTCCAG AGAAACCACA AGGCGTGATT 2640 

TGGACTGACG CGCAATGGCA AAGTATTTAC GCAACTGGAC AAGATGTACT TGTTGCAGCC 2700 

40 

GCGGCAGGTT CAGGTAAAAC AGCTGTACTA GTTGAGCGTA TTATCCAAAA GATTTTACGT 2760 

GATGG CATTG ATGTCGATCG ACTTTTAGTC GTAACGTTTA CAAACTTAAG CGCACGTGAA 2 820 

45 ATGAAGCATC GTGTAGACCA ACGTATTCAA GAGGCATCGA TTGCTGATCC TGCAAATGCA 2 880 

CACTTGAAAA ACCAACGCAT CAAAATTCAT CAAGCACAAA TATCTACACT CCATAGTTTT 2 940 

TGCTTGAAAT TAATTCAACA GCATTATGAT GTATTAAATA TTGACCCGAA CTTTAGAACA 3 000 

50 AG CAGTGAAG CTGAAAATAT TTTATTATTA GAACAAACGA TAGATGAGGT CAT AG AA CAA 3 06 0 

CATTACGATA TCCTTGATCC TGCTTTTATT GAATTAACAG AGCAATTGTC TTCAGATAGA 3120 
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AATCCTACAA ATTGGTTGGA TCAATTGGTG ACACCATACG AAGAAGAAGC ACAACAAGCG 324 0 

CAACTTATTC AACTACTAAC AGACTTATCT AAAGTATTTA TCACAGCTGC TTATGATGCT 3 3 00 

TTAAATAAGG CGTATGATTT GTTTAGTATG ATGGATAGCG TCGATAAACA TTTAGCTGTT 33 6 0 

ATAGAAGATG AACGACGTTT AATGGGGCGT GTTTTAGAAG GTGGCTTTAT TGATATACCT 34 2 0 

TATTTAACTG GTCACGAATT TGGCGCGCGT TTGCCTAATG TAACAG CGAA AATTAAAGAA 34 8 0 

GCAAATGAAA TGATGGTCGA TGCCTTAGAA GATGCTAAAC TTCAGTATAA AAAATATAAA 3 54 0 

TCATTAATTG ATAAAGTGAA GAGTGATTAC TTTTCAAGAG AAGCTGATGA TTTGAAAGCT 3600 

GATATG CAAC AATTGGCGCC ACGAGTAAAG TACCTTGCGC GTATTGTGAA AGATGTTATG 366 0 

TCAGAATTCA ATCGAAAAAA GCGTAGCAAA AATATTTTGG ATTTTTCTGA TTATGAACAT 3720 

TTTG CATTAC AAATTTTAAC TAATGAGGAT GGTTCGCCTT CAGAAATTGC CGAATCATAC 378 0 

CGTCAACACT TCCAAGAAAT ATTGGTCGAT GAGT AT CAAG ATACGAACCG AGTTCAAGAG 3 84 0 

AAAATACTAT CTTGCATCAA AACGGGTGAT GAACATAATG GTAATTTATT TATGGTTGGA 3 90 0 

GATGTTAAGC AATC CATTT A TAAATTTAGA CAAGCTGATC CAAGTTTATT TATTGAAAAG 3960 

TATCAACGCT TTACTATAGA TGGAGATGGC ACTGGACGTC GAATTGATTT GTCGCAAAAC 4 020 

TTCCGTTCTC GAAAAGAAGT ACTGT CAACG ACTAACTATA TATTCAAACA TATGATGGAT 4 08 0 

GAACAAGTCG GTGAAGTAAA ATATGATGAA GCGGCACAGT TGTATTATGG TGCACCATAT 414 0 

GATGAATCGG ACCATCCaGT AAACTTAAAA GTCCTTGTTG AAGCGGATCA AGAACATAGT 4 2 00 

GATTTAACTG GTAGTGAACA AGAAG CGCAT TTTATAGTAG AACAAGTTAA AGATATCTTA 426 0 

GAACATCAAA AAGTTTATGA TATGAAAACA GGAAGCTATA GAAGTGCGAC ATACAAGGAT 4 32 0 

ATCGTTATTC TAGAACGCAG CTTTGGACAA GCTCGCAATT TACAACAAGC CTTTAAAAAT 43 80 

GAAGATATTC CATTCCATGT GAATAGTCGT GAAGGTTACT TTGAACAAAC AGAAGTCCGC 444 0 

TTAGTATTAT CATTTTTAAG AG CGATAG AT AATC CATTAC AAGATATTTA TTTAGTT GGG 4 50 0 

TTAATGCGCT C CGTTATAT A TCAGTTCAAA GAAGACGAAT TAGCTCAAAT TAGAATATTG 456 0 

AGTCCAAATG ATGACTACTT CTATCAATCG ATTG 4 594 
(2) INFORMATION FOR SEQ ID NO: 201: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH ; 6 313 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 
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GGTTTTCnTG GAAAGATAGT GAAAATCTCG TGTTTTTTGG TTTTgAGGTG TTGTTTGTAT 6 0 

TTTaTAAAAT GGCTTACATA TATGAAGCGT TGATTAAGTA TGGAATTGTT AATTAATTGA 12 0 

ACCTATTTAG CTTTAAGAAG GCATAACAAG ATGACCTTAT TTTATGCTAT AATATTTCTA 180 

TTATGCGAAG ATTAAGGTGA GTAGTAAATT GGATAAAAAA GTAAGTATTC AAACAAAGCA 24 0 

AGTGTTGAAA CAGCACAACG AAAAAGAAAA ATTTGAATTT ACTACTGAAG GAACTTGGCA 3 00 

ACAAAGGCAA TCTAACTTTA TTCGGTATGT AGAACAAATT GAGGATGCAA CAGTTAATGT 3 60 

TACAATAAAA GTGGATGATG ATAGCGTTAA GTTGATTCGT AAAGGCGACA TTAATATGAA 420 

TTTGCATTTT GTTGAAGGAC AAACGACAAC AACTTTTTAC GATATAT CGG CTGGACGAAT 48 0 

TCCACTAGAA GTTAAAACAT TACGCATTTT ACATTTCGTA AGTGGAGACG GTGGCAAGCT 54 0 

AAAGATTCAT TATGAATTAT AT CAAG ATAA TGAAAAAATG GGTTCTTATC AATATGAAAT 600 

TAACTATAAG GAGATAGGCG AATGAATATT ATTGAT CAAG TGAAACAAAC ATTAGTAGAA 660 

GAAATTGCAG CAAGTATTAA CAAAGCAGGA TTAGCAGATG AGATTCCTGA TATTAAAATT 72 0 

GAAGTTCCTA AAGATACAAA AAATGGAGAT TATGCTACTA ATATTGCGAT GGTACTGACT 780 

AAGATTGCAA AGCGTAATCC TCGTGAAATT GCTCAAGCGA TTGTTGATAA CTTAGATACT 84 0 

GAAAAAGCAC ATGTAAAACA AATTGACATT GCTGGTCCAG GATTCATTAA TTTTTACTTA 900 

GATAATCAGT ATTTAACAGC AATTATTCCT GAAG CAATTG AAAAAGGTGA TCAATTTGGA 96 0 

CATGTAAATG AATCAAAAGG TCAAAATGTA TTGCTTGAGT ATGTTTCAGC TAACCCTACA 102 0 

GGAGATTTAC ATATTGGTCA TGCTAGAAAT GCAGCAGTTG GTGATGCTTT AgcTAAtATT 108 0 

TTAACTGCAG CTGGCTATAA TGTAACACGT GAATATTATA TTAATGATGC TGGTAATCAA 114 0 

ATTACTAACT TAGCGCGTTC GATTGAAACA CGTTTCTTTG AAGCTTTAGG TGACAATAGT 12 00 

TATTCAATGC CAGAAGATGG CTATAATGGA AAAGATATTA TTGAAATAGG TAAAGATTTA 12 60 

GCAGAGAAAC ACCCTGAAAT TAAAGATTAT TCTGAAGAAG CACGTTTGAA AGAATTTAGA 13 20 

AAATTAGGCG TAGAATACGA AATGGCTAAA TTGAAAAATG ATTTAGCAGA GTTCAATACG 13 80 

CATTTTGATA ATTGGTTTAG TGAAaCATCT TTATATGAAA AAGGAGAAAT T CTTGAAGTT 144 0 

TTAGCAAAAA TGAAAGAATT AGGTTATACG TATGAAGCTG ATGGCGCTAC ATGGTTACGT 15 0 0 

ACAACTGATT TTAAAGACGA CAAAGACAGA GTATTAATTA AAAATGACGG TACATATACG 1560 

TATTTCTTAC CAGATATTGC GTACCACTTC GATAAAGTAA AACGTGGTAA TGACATTTTA 1620 

ATCGATTTAT TTGGTGCTGA TCATCATGGT TATATTAATC GTTTGAAAGC ATCTCTTGAA 16 80 

ACGTTTGGTG TAGATAGTAA TCGTTTAGAA ATTCAAATCA TGCAAATGGT TCGTTTAATG 174 0 
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ATTATGGACG 


AaGTTGGCGT 


TGACGCTGCA 




AGTCACTTTG 


ATTTTGATAT 


GGAATTAGCG 


5 


TATGCTCAAT 


ATGCACATGC 


GCGTATTTGT 




ATTGAAGTGA 


CTGCTGCGAA 


TGATTTTACA 




TTGAAAAAAG 


TAG CTGATTT 


CGAAC CTACA 


10 


CATAGAATTA 


CTAATTATAT 


TCAAGATTTA 




GAAAAAGTGT 


TAA CAGATGA 


TATTGAAAAA 




GTCAGAATTA 


CATTGAAAAA 


TGCATTGGCA 


TAAGAACATT 


TATATACACT 


CCAACGTAGA 




TTTTTTTTAG 


GTATGTGACA 


TATTGGGGAA 


20 


CACAGTTGGA 


TGCTCTGCAC 


AACTGCATAA 




GCTCTACAAA 


GTTATAATGG 


CAGTAGTTGA 




TTTCAATTCT 


AGTCAACCTT 


GCCGGCGGGG 


25 


TCTACAGACA ATGCAAGTTG 


GGGTGGGACG 




TGTCCCACTC 


CCTCTAAAAT 


GGAGGGTGTA 




TTTATATGAA 


CATCTCGGAC 


CACAATTTTG 


30 


GTTAGGTGCA 


ATTTTAGTTC 


AAAATACTAG 




GATTAAAGAA 


CATACGCATT 


TTAATCCAAA 




ACAATCATTG 


ATACATTCAA 


GTGGCTTTTA 


35 


ATTAACATGG 


TTAGCACGAC 


ATCATTTCAA 




TGGATTAAGA AAAGAATTAT 


TATCTTTGAA 




ACTTGTTTAT 


ATATTCGGAC 


GTATTGAATT 




TGATAAATTA 


GGATATGAAA 


ACACTAAAAA 




ACCAAATCAT 


TTTACAAATC 


AAGATGCTAA 


45 


TAAACATTAC 


TTTAGAGACA 


AAGATATAAA 




AAAGTAAACG 


CTGTGAAGTT 


AGATAGATGA 




ATTTTCTTTT 


AGTATGTGGA 


CTTATATAAT 


50 


GTTTGTTTGT 


GCAGCAACTG 


CATAAGAGCC 




GAATACAGTT 


GTTTGTGCAG 


CAACTGCATA 
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CGTTATTTCT TAACTATGCG TAgTCCTGAT 18 60 

AAAGAGCAAT CTCAAGACAA TCCAGTTTAC 192 0 

TCAATTTTAA AACAAGCGAA AGAGCAAGGT 19 80 

ACGATTACTA ATGAAAAAGC G ATTGAATTG 2 04 0 

ATTGAAAGTG CTGCTGAGCA TAGATCGGCA 2100 

GCTTCTCATT TCCATAAATT CTATAATGCT 2160 

ACAAAAGCAC ATGTTGCTAT GATTGAAGCG 2 2 20 

ATGGTCGGTG TAAGCGCACC TGAATCAATG 2 2 80 

GTTTCTCGAA AGATACTTTG TGTTGGAGTG 234 0 

TGCTTAGTAT GTGAATAAGG TTAAGAGGAA 24 00 

GAGAGCCTGA GACATAAATC AATGTTCTAT 24 60 

CTGAACGAAA ATTCGCTTGT AACAAGCTTT 2 52 0 

CCCCAACAAA GAGAAATTGG ATTCCCAATT 2 580 

ACGAAATAAA TTTTACGATA ATATCATTTC 2 64 0 

AATGTTAGGA ACTGATGAAT TATATAAAGT 2 7 00 

GTGGCCTGCT GATAATGACA TTGAAATGAT 2760 

ATGG CGAAAT GCAGAAATTG CATTGAATCA 282 0 

TCATATATTA GAACTACCTA TTGAAACGTT 2 8 80 

TAAAAGTAAA TCACTGACGA TTAAAACATT 2 94 0 

TTATCAAGAG ATTAATGAGC GATATAAAGG 30 0 0 

AGGTATTGGA AGTGAAACAG CAGATGTCTT 306 0 

TATTCCAGAT AGCTATACAA GAAAAATATA 3120 

TTATGATCAA TTAAAAAAAG TAGTCaCATT 3180 

TGAATTT CAT GCTCTGTTAG ATGTATTTGG 3 2 40 

GAATTATGAT TTTTTAGAAC CTTACTTTAA 33 00 

GTTTATATGA AATATAAAAA ATAATTTACT 3360 

AAATAGAAGC ATATAAAGAA AAAAACAGTT 34 20 

CCTAATCGCT AAAGCTCAAG GGGAGTAAAG 3 4 80 

AAAGCCTCTA ATCACTAAAG GTGAAGAGGA 354 0 
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AACGCAGTTG GATgCTACCG CACAACTGCA TAAATCCCTC TaATCgcTAA AGCGAAAAGT 3 6 60 

GGGATTAAAA AGGAGATGTG ATAGTGTGAA GAAATCGTTA ATTGCTTTTA TTTTGATTTT 3 72 0 

5 TATGCTTGTC CTGAGTGGCT GTGGTATGAA AGATAATGAT AAACAAGGTA GCAATGATAA 3 78 0 

TGGCTCGTCT AAATCGCCGT AC CAT AGAAT TGTTTCGTTA ATGCCTAGTA ATACTGAAAT 3 84 0 

TTTATATGAA TTAGGATTAG GTAAATACAT AGTTGGTGTT TCAAC GGTTG ATGATTATCC 3 900 

'° AAAAGATGTG AAAAAGGGTA AGAAACAATT TGATGCTTTG AATCTAAATA AAGAGGAACT 3 960 

TTTAAAGGCA AAGCCAGATC TAATTCTTGC GCATGAGTCG CAAAAGGCAA CTGCTAATAA 4 02 0 

AGTATTGTCA TCATTAGAGA AACAAGGCAT CAAAGTAGTG TATGTTAAAG ATGCACAATC 4 080 

rs 

AATTGATGAA ACTTACAACA CATTTAAGCA AATTGGGAAA TTAACGCATC ATGATAAGCA 414 0 

GGCTGAACAA CTTGTTGAGG AAACTAAAGA TAATATCGAT AAAGTCATAG ATTCAATTCC 4 200 

TGCTCATCAT AAAAAATCAA AAGTATTTAT TGAGGTTTCA TCAAAGCCTG AAATATATAC 4 260 

20 

AGCAGGGAAG CATACATTTT TTAATGATAT GTTAGAAAAA TTAGAAGCCC AAAATGTGTA 4 3 20 

TAGTGACATT AATGGTTGGA ACCCTGTAAC GAAGGAAAGT ATT AT TAAAA AGAACCCAGA 4 3 80 

25 TATATTAATT TCGACGGAAG CTAAGACAAG ATCAGATTAT ATGGATATCA TCAAAAAAAG 444 0 

AGGTGGATTC AATAAAATTA ATGCTGTCAA GAATACACGT ATTGAAGTTG TAAATGGTGA 4 5 00 

TGAAGT AT CA AGACCAGGTC CACGTATTGA TGAAGGATTA AAAGAATTAA GAGATGCAAT 4560 

30 TTATAGAAAA TAAACCATTC TAATTATGCC CCTTATTGCT ACATGTAAAA AATACATGTT 4 620 

TGAGATAAGG GGTTTTTaAA ATATATTTAG TGAATGATAG CAACGCGAGT ATGTGATTGC 4 6 80 

TATAATGAAT GTAATTATCG ATGAAcaaAA GAGAATGCTA TGACATTTAA TAAAGTATTA 4 74 0 

35 TTGAGCTGGa TAGTCmTATT GATTATAACA ACTAGCATAT ATCTATTTTG GCAGTTGGGC 4 8 00 

GATATCAATG ATGTATTTAA CCAGTCTATT TTAATCAATG TTAGATTAC C GAGATTATTA 4 860 

GAAGCATTGT TGACAGGTAT GATATTAACT GTTGCAGGCC TTATATTTCA AACAGTTTTA 4 92 0 

40 

AATAATGCAT TGGCAGATAG CTTTACATTA GGATTGGCAA GCGGCGCTAC ATTTGGTTCA 4 980 

GGATTAG CAT TATTTTTAGG TTTAACAACG TTATGGATTC CTGTATTTTC AATAACATTT 5 04 0 

4s AGTTTGATAA CATTAATAAC TGTATTAGTC ATTACGTCGG TATTGAGCCA AGGCTATCCA 5100 

GTTAGAATCT TAATATTAAG TGGTTTAATG ATTGGTGCGT TATTCAATTC ACTTCTATAT 516 0 

TTTTTGATTT TATTAAAACC TCGCAAATTA AATACAATTG CCAATTATCT GTTTGGTGGT 52 2 0 

50 TTTGGTGATG CAGAATACTC AAATGTATCT ATAATAGCAA T CACATTT AT CATTGCATTG 5 2 80 

TTTGGTATAT TTATCATTCT TAATCAACTA AAGTTATTGC AATTAGGAGA ACTAAAAAGT 5 34 0 
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ATAACGGCGA TAAATGTCGC ATATGTTGGC AT CATTGGAT TCATTGGTAT GGTGATACCG 54 6 0 

CAACTCATTA GAAAATGGCA GTGGAAACAA TCATTAGGAA GACAATTGGC TTTAAATATT 5 52 0 

s GTAACTGGAG GACAAATAAT GGTTATGGCA GATTTTATTG GTAGCCATAT ATTGTCACCA 5 5 80 

GTACAAATAC CGGCAAGTAT TATCATTGCA TTAATTGGTA TACCAGTGTT AtTTTACaTG 5 640 

CkAAwAtCtC aGTCgAAAcG GTTACaCTAG CACACGACaT TTGCTAAAAT AAAAATAACT 5 700 

'° ATAAACATAA AGAGGGCATA AGC GATGGAT TTGAATCAAA TTAAAGCAGT TGTATTTGAT 57 6 0 

TTAGAAGGTA CGTTGTTGGA CAGAGTTAAA TCTCGAGAGA AATTTATCGA AGAGCAATAT 5 82 0 

GAACGATTTC ATGACTACTT AATT CATGTT CAACTGGCAG ATTTTAAAAA AgCATTTATT 58 80 

15 

GAGCTAGATG ACGATGAAGA TAATGATAAA CCTGATTTAT ATAAAGAAAT CATTAAACGT 594 0 

TTCCATGTAG ATAGGTTAAC TTGGAAAGAC TTATTTAATG ATTTTGAAAT GCATTTTTAT 60 0 0 

CGTTATGTAT TTCCTTATTA CGATACTTTG TATACACTAG AAAAgCTATC GCAAAAAGGC 606 0 

20 

TTTCAAATTG GTGTTATCGC AAATGGTAAA TCTAAGATTA AACAATTTCG AT TACATTCA 6120 

CTTGGTTTGA TGCATGTTAT TAATTATTTA TCAACATCAG AAACAGTTGG TTTTCGTAAA 618 0 

2S CCACATCCTA AAATTTTTGA AGATATGATT GATCAACTAG GGGTATTACC TGAGCAAATT 624 0 

ATGTATGTTG GCGATGATGC GTTAAATGAT GTAGCTCCAG CACGAGCTAT GGGCATGGTT 63 00 

AGTGTATGGT ATA 6313 

30 (2) INFORMATION FOR SEQ ID NO: 2 02: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2174 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
35 (D) TOPOLOGY: linear 

' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 202: 

40 

CCGTAAACAC ATCAACAAAA GAAGGCTATA TTACAAAAGA AGACTTGGAC TTATGCTGCA 60 

CGTCGCTCTA ATTCAGCTGG AATGCAAGTC ACCGGACGAC TGGCTTACAT TGAACCTTAT 120 

GGGGCAACAA GTCGCACAAA ATAAACGCGC GAGAAGCaAG AATAGGAAGT GATATCTATG 180 

45 

AAATGGTTAT CACGAATATT AACAGTAATA GTGACCATGT CtATGGcGTG TGGTGCATTG 240 

ATATTTAATC GTAGACATCA GCTAAAGGCG AAAACGCTGA ACTTCAATCA TAAAGCATTA 300 

so ACAATTATTA TTCCGGCTAG AAACGAAGAA AAAAGAATAG GTCATTTACT ACATTCGATA 36 0 

ATACAACAGC AAGTTC CAGT AGATGTCATT GTTATGAATG ACGGATCGAC AGATGAAACA 420 
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AAATGGTATG GGAAATCACA TGCTTGTTAT CAAGGTGTGA CGCATGCATG TACGAATCGC 540 
ATTGCCTTTG TAGATGCTGA TGTAACTTTC TTAAGGAAAG ATGCTGTTGA AAC GTTGATT 600 
AATCAGTATC AATTACAAGG TGAAAAAGGA TTGTTAAGCG TACAGCCTTA TCATATAACA SGO 
AAGCGTTTCT ACGAAGGGTT TTCAGCGATA TTTAATTTAA TGACAGTCGT TGGTATGAAT 72 0 

GTATTTTCTA CCTTAGACGA CGGTCGGACT AACCAGCATG CATTTGGACC GGTGACATTA 780 
ACAAATAAAG AAGATTATTA TGCAACTGGA GGTCATAAAA GTGCAAACCG T CAT ATT ATT 84 0 

GAAGGATTTG CTTTAGGAAG TG CATATACT TCACAATCAT TGCCCGTAAC AGTTTATGAA 900 
GGGTTTCCAT TTGTTG CATT TCGCATGTAT CAAGAAGGAT TTCAGTCATT ACAAGAAGGA 960 

TGGACAAAGC ATTTGTCAAC TGGGGCAGGT GGCACAAAGC CTAAGATCAT GACAGCAATT 1020 

GTGTTGTGGT TGTTTGGTTC TATAGCGAGT ATTTTAGGGC TATGTCTTAG TTTAAAATAT 10 80 

CGCCAAATGT CTGTAAGAAA AATGGTAGCA CTTTACTTGA GCTATACTAC ACAATTTATT 1140 

T ATCTG CATC GAAGGGTCGG CCAATTTTCT AATTTATTAA TGGTATGTCA TCCATTGTTA 1200 

TTTATGTTTT TTACTAAAAT TTTCATCCAA TCTTGGAAAC AAACG CATCG TTATGGTGTA 12 60 

GTTGAATGGA AAGGTCGTCA ATATTCTATA TCTAAAGAAC AATAAATCAA GGTAATGGCA 1320 

TTTCAATATA GGAGGACTAG TATGACAATG ATGGATATGA ATTTTAAATA TTGTCATAAA 13 80 

ATCATGAAGA AACATTCAAA AAGCTTTTCT TACGCTTTTG ACTTGTTACC AGAAGATCAA 14 4 0 

AGAAAAGCGG TTTGGGCAAT TTATGCTGTG TGTCGTAAAA TTGATGACAG TATAGATGTT 15 00 

TATGGCGATA TTCAATTTTT AAATCAAATA AAAGAAGATA TACAATCTAT TGAAAAATAC 15 60 

CCATATGAAC ATCATCACTT TCAAAGTGAT CGTAGAATCA TGATGGCGCT TCAgCATGTT 162 0 

GCACAACATA AAAATATCGC CTTTCAATCT TTTTATAATC TCATTGATAC TGTATATAAA 16 80 

GATCAACATT TTACAATGTT TGAAACGGAC GCTGAATTAT TCGGATATTG TTATGGTGTT 174 0 

GCTGGTACAg TAGGTGAAGT ATTGACGCCG ATTTTAAGTG ATCATGAAAC ACATCAGACA 18 00 

TACGATGTCG CAAGAAGACT TGGTGAATCG TTGCAATTGA TTAATATATT AAGAGATGTC 1860 

GGTGAAGATT TTGACAATGA ACGGATATAT TTTAGTAAGC AACGATTAAA GCAATATGAA 192 0 

GTTGATATTG CTGAAGTGTA CCAAAATGGT GTTAATAATC ATTATATTGA CTTATGGGAA 1980 

TATTATGCAG CTATCGCAGA AAAAGATTTT CAAGATGTTA TGGATCAAAT CAAAGTATTT 204 0 

AGTATTGAAG CACAACCAAT CATAGAATTA GCAGCACGTA TATATATTGA AATACTGGAC 2100 

GAaGTGAGaC AGGCTAACTA TACATTACAT GAACGTGTTT TTGTGGaTAA GAGGAAAAAG 2160 

GCAAAGTTGT TTCA 2174 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 4715 base pair. 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 203: 

GAAnCAGnTA GACAAATTAT GGaAAmCGGT GTGAATCaAG GATTCtTTGG TGTAGCTGGT 60 

TTTGACCTAC TCGTCGATGA GGATGATAAC GTTTATGCGA TTGATTTAAA CTTTAGACAA 120 

AATGGTTCaA CGAGCATGTT ATTACTTGCT AACGAGTTGA ATTCAGGATA TCAAAAGTTT 180 

TATAGTTATC ATTCAAAAGG TGATAACACA CATTTCTTCA ATACGATTTT GAAATATGTC 24 0 

AAAGAAGGTA GTTTATACCC GTTATCTTAT TATGATGGTG ATTGGTACGG TGAAGATAAA 300 

GTTAAATCAA GGTTTGGCTG TATTTGGCAT GGTGATTCAA AAGAAACAGT ACTGGAGAAT 3 60 

GAACGCGCAT TTTTAGCTGA ACTTGAACAC TATTAGAGTT CGGAACATAA GGCGCTACAA 42 0 

TGTTGTGTTG CCAGTAGTTG ACTGAATATG CGTTTGTAAC AAGCTTTTTT CGATTCTAGT 480 

CAACAGTAAT TAAATTTATG ATATGGCAAT ACTTTGTAAT ACTAATATTA AATGGCGACT 54 0 

TTTATTTCAC TATGTTATAA GAGTTGCCAT TTTGTTGATA AAGGTATACT AAAGGTTATC 600 

GTTTTGAAAT TTTTAGTAAC TAGATATGTT TCGT GTTATA GAC CGAATTT GTGTATACGT 660 

AAAATTTAAT GCTATTGAAT TTTTAAAATG AAAAACATGA CATTAAATTG AATTCATAAT 72 0 

ATGTCTAATT GACTAACTTG TTGGAGTCAT TTACTATTTT ATGTATGACA TATTTTAAAA 78 0 

AGTGAGGGTC AAGCATGTCT TATAAAGCAT ATC CATTCTT TAGAGATATA TTAATAAATG 840 

AATGTATTTA TTTCGCCTCT AAAAATAAAA AACTAGTACG CCTAAATTAT AAAAGTGAAG 900 

CGnATGTAGG CGTTTGGACA GAAGAAAGTG TGGCCGTATC ATTTTTAACA AGTCGTGATA 96 0 

TTCCATTTGA TAAAGTTGTA AAAATGGACG TTGATCGTTT TGCTACTTAT GAATTAGATG 102 0 

AATTGTTTGA TGAACAAGAC CATATTATTA TGAATCAAAC AATGGAAGAw GAAGGGCATC 1080 

TACTAAACGT TGTAGCTGTT ACACAAGAAG TGATGACGGA ATTAGATAAA ATTAGAATCA 1140 

AAGAATTTGT CCAAGATGTA GCGAAATATG ATGAAGTATA CGGCTTAACT AAAAAAGGTA 1200 

GTAAGCAGTT TATTCTCATT AGTGAAAATG ATAGCGACGA AAAAAAGCCG CATATTATGC 1260 

CTGTATGGAG TATTAAAAAC AGAGCGTTAA AAGTTCGAGA TGAAGATTTT GAAGAGTGTG 1320 

ATTTAATTAC GATTGAAGGT TCTGTTTTCG GAGAATGGCT AGATGAACTT AGAGATGATC 1380 

ATAAAGCCGT TGCGATAGAT TTAAAAACTG GCGTGGTTGG TACAATTGTT TCAGCGCAAA 144 0 
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ATGGAACAAT ACGTATTCAA AACACTTAGA CCATAAAATA AAAGGCCATT TATATAGCGT 1560 

TTATTTAAAA CAACGCGCAT ATAAATGGTC TTTTTCTATT TTTCTAAATA TAATGCACCA 162 0 

ATAGCACCTG nAAAATGCGC CGTTTTCAAC ATAGTACGGT TTGCAACCGC GTAACACAGT 168 0 

ATAATCTTCC ACAACTTTGC GTAATAAAGC GTTATTATGA AATGAAGAAC CGATATAAAC 174 0 

GAT ATT IT CA GTTTTAAATT CACGTGCAAC AGTAATGGCC ATTGTCGTAA CAACTTCGCC 1S00 

AACGACACCA ATAACGGCTG CTAATTTATT GCTAGGTGTA AAATCAG CAT CTAAATGATG 1860 

TAG TACATGA CCAAAATTAG CTGCTGTTAA AT CAC CGGGA ATGGGTGGTT CGGTATCTTT 192 0 

ATAAATATGT CTAACCTTTA AATCGATAGT GTTACGATCA CCGTGTTGTG CCATGTCAGT 19 80 

TAACTGTTTA TAATCAGTGA TTTGACTTAG TAAATAACCG AGTCCTTGAA TCATGCCTCC 2 04 0 

ACCTGTACCG ATACCGCCTA CACGACGTTG TGATTGGCCG TCGAAATAAT GTAGTGACGT 2100 

ACCGGTACCA ACATTTGCAA AAATATAATC TGCTAAGTCA TGGCCTTGCT CTTTTAACAA 2160 

AATACCTAGT CCTTGAGATG CAGCATCAAA CTCTACAAAA ATTTGTGCAG GAATGTTGAT 22 20 

GTTTTCAGCA ATGACACCTG CATTACCTCC AGTTAAGCAT AATTTTTCAA TTTGCTGTTG 2 2 80 

GTTTAACCAT TCCACAACTT GATCAATATT TTTAGTTAAT T CAGTTTTAA AAGTACGTTG 2 34 0 

GTTATCTTGC TCTTGAACGA TTTTAATTAG TGTACCGCCA GCGTCAATGC CAACTTTCAT 24 00 

AAGATTCCCA CCTCATTATT AATGTCTATC CTTAAATAAT AGTATAGTAA AATGACTAAA 24 6 0 

AAACAAGTAA TAATAGTAAT TATTAACAAA TTTGATGCCa TTGCATTTCA ACATTGTAAG 2 52 0 

cGTATCGCAA TTAAtGTTTT ACAAACGTGG ACGTTAAGTt ATATATATTA TTTTCTAGGA 2 5 80 

ATTTTGAAGT TGTATAGGAT TGTTAGTTAG TGACGCAATA TTAAAAGTAG TTCGTACGCA 2 640 

GTGTATTTGT AAGTCTCTGA TTAAAATGAT AAGTAATGAG GAATAGTACA TTAATTTTGA 270 0 

AATTTAAAAA ATATAAATAA GTAATTTATT TAACTTAGAG CAAATAATGG TATCGTAGTG 27 60 

AAATAATAGG TAAAATAATA TGGGGATTCA TGCTTCATAT ATAAAAAGAT AGGGGTTAAA 2 82 0 

TATATGGCTA AAGAACTTTG TTTTGAAGGT ATCACTTTAA AAGCATTTGA TGAACAATAT 2 880 

CGTTCAGCAA TTAATGATTT TGACTTGAAT GAAAGACAAC AAATATATTC ATCTTTACCT 294 0 

AAAGAAGTTA TTGATGATGC AATTAATGAT GCTGATAGGA TTGCTAACGT AGCAwTAAmC 3 000 

GATAAAAATG AAGTGGTGGG CTTTTTTGTA TTACATCGTT ACTATCAGCA TGAAGGTTAT 306 0 

GATACACCTG AAAATGTCGT TTATATTCGT TCATTATCGA TTAATGAAAA ATATCAAGGT 3120 

TTTGGATATG GCACGAAAAT AATGATGTCA TTGCCGCAAT ATGTTCAAGG TGTATTTCCT 3180 

GATTTTAATC ATCTATATCT AGTAGTAGAT GCGGAAAATG ACAATGCTTG GAACCTATAC 324 0 
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CTATATTACT TGGACTTAGA TTCAAAACAT GTTTCATCAT TAAAGCTTGA AGAAGAAAGT 3 36 0 

CGTTCAGAAG TGACCAATGT ACATATCATT AATTTAATGA TTGATGGCCA AAAGGTTGG C 34 2 0 

TTTATCGCAT TGGAGCAGAT TGGTGAACGC ATGAACATTG CTGCTATTGA AGTGGATAAA 3 4 80 

TCATATCGCT TTAATGGTAT TGGTTCAAGT GCTCTGCGAC AATTGCCAAC TTACTTAAGA 3 54 0 

AAAAACTATG ACAACCTTAA TGTGATTAC G ATGATTCTGT TTGGAGAGAA TAATGATTTT 360 0 

AAACCATTAT GTTTAAATAG TAATTT CGTT GAAATCGAAC AAACTGATGA TTATGTCGTT 3 66 0 

TTCGAAAAAT ATTTAAATTA CTAACAGTGA TTGCGAAATA TGATATTGTC ATTTATAATT 3 720 

TAGTTTTGTT ACTATATATA AATGAATTCA GACGTATAAA TTTAGATTAT ATCCTTCGAA 3 7 80 

AGGAAGTATT GGGCAATGAA AATTCAAGAT TATACAAAAC AAATGGTTGA TGAAAAATCA 3 84 0 

TTTATTGATA TGGCTTATAC ATTATTGAAT GATAAAGGCG AAACAATGAm mTTATATGAT 3 900 

ATyATCGATG AATTTAGAGC GTTAGGTGAT TATGAGTACG AAGAAATTGA AAATCGTGTT 3 960 

GTACAATTTT ACACGGATTT AAACACAGAT GGTCGTTTTT TAAATGTTGG AGAAAATTTA 4 020 

TGGGGATTAC GTGATTGGTA TTCGGTAGAT GATATTGAAG AGAAAATCGC ACCAACTATT 4 080 

CAAAAATTCG ATATTCTGGA TGCAGATGAT GAAGAAGATC AAAACTTAAA ATTATTGGGC 414 0 

GAAGATGAAA TGGATGACGA CGATGATATT CCAGCTCAAA CAGATGATCA AGAAGAACTA 4 20 0 

AATGATCCAG AAGATGAGCA GGTTGAAGAA GAAATCAATC ATTCGGATAT AGTCATTGAA 4 260 

GAAGATGAAG ATGAACTAGA CGAAGACGAA GAAGTGTTTG AAGACGAAGA AGACTTCAAC 4 32 0 

GATTAATTTT TTGTTTGACT TTTAGTTGAA AGATGATAAA ATTTTATTCG GGCTCCTTTA 4 38 0 

AATAGGACAC GTGTATAAAA TTTATACGCT CCCCTTACAG AATTTGTGAG AGGGAGCGTT 4 44 0 

TTTTtATTTA ATTGAGTAAA TCAAGAAATG ATAACGCAAA AAT CAAAGTT GTAAATGATA 4 500 

TACATAGTGA CAT AG CAGT A TGGAAACGGT AAGTAAACAG AATTTAATTT TGTCGAtTCG 4 56 0 

ACAAtAAaCA aCTtGAaTGA GCTTGCTTTA ATGTTATGTn nTACGTAATT TTTACAATTG 4 62 0 

ATGAGGAAGC ATTCCCTTTA ATAATTAGGA GGTCAAGACA TGACAAAATT TATTTTTGTA 4680 

ACAGGTGGCG TAG TTT CATC CATTAGGGGA AGGGT 4715 

(2) INFORMATION FOR SEQ ID NO: 204: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 918 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ATAATAACTG 


AAATTAAAAT 


TGCTAAATmG 


TGTTaAgCTA TCGCmACAAT GAAAATwCCG 


60 


ATTTTGCGTT 


GTTGAAAATA 


TCTTTCCAAA 


CCAAGAATCG 


ATAATGGCAA TAAATATAAT 


120 


AAATTTCCAT 


AAAATGACCA 


AGTAAAATTA 


AAGTATATAA 


CGACAGTTGA CATGCCGTAT 


180 


AAAATCGTAG 


CGAT CATATT 


TGCTGAGCGT 


TTAAAGTGTA 


ATATTTTAAA TAAGTAGAAG 


240 


GTCACGACAA 


ATGTTATGAT 


AGCTCGTATC 


ATAGCCATAA 


TAAGTTGGTT TGTCGGCCAA 


300 


AAATGTATTG 


TCGTCGGATT 


AAATATACCA 


ACCGTTTCTC 


CTATTTTAAT GAAkAGAAAA 


360 


TTTAGCCACA 


TTAAAGGTGA 


CAGCGAATAA 


TAATnTGATA 


GTCCTTTCAT ATAATCGCCA 


420 


CCTAmTCCAA 


ACGATGCATC 


ATrTAAACTA 


GAAnAACTAC 


GTAGATGTTC ATACAnATAC 


480 


ATTTGAAATG 


GCATCATTTG 


ACGGAATCCA 


TCTCCAGCCC 


CGCTAAAAAC AGTACCATTC 


540 


ACAATATAAT 


CATAGATATG 


AGTAGAAAAT 


AAAATAAGCG 


TTAATATTAC ACTAATGAAA 


600 


GTTATAACAA 


AGAATTGTTT 


GACGTTTGAA 


TTTAGCCACT 


TTTTTAACAC AACATTATC C 


660 


TCAACTTTCA 


AATTTAAAAT 


TAAGTTTAAC 


TGAAACTAAA 


GTTAATGAGG TTCTTGATAG 


720 


GTAAAGACGA 


AGATGACTGT 


GGAACAGATA 


CCTTATCATA 


GTTACTTAAA CTTTGGATCA 


780 


TTTTCAGTTT 


ATCATTAAAC 


AAATATATTG 


AATAATAAAa 


aTGTCATACT GATAAAGATG 


840 


AATGTCACTT 


AATAAGTAAC 


TTAGaTTTAA 


CAAATGATGA 


TTTTTAATTG TAGAAAACTT 


900 


GAAATAATCA 


CkTATACC 
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(2) INFORMATION FOR SEQ ID NO: 2 05: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 16397 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 205: 



TCGCCCnATA 


ATCAATTTAT 


TTTTCATGTG 


CCACTCCTAT 


ACAAGCTnAC AATGCTTCTT 


60 


CAGTTAAGGC 


AATATCTTTT 


AATTTTGTTT 


GATATTTTTG 


TTCAAAGTCA TATTGTAACT 


120 


GAACAATTTC 


TGGCAAACCA 


ATATGCCAAT 


CCGCCAATTT 


TTTTTTAyCT Tt GAAGAGCT 


180 


CTTTTGGTGA 


TGkTTGcGAC 


ACTATACTAC 


CTTCTTTCAT 


AACGATGACT TCATCTGCAT 


240 


AACGCGCGAC 


TTCATTCATA 


TCATGTGAAA 


TTAGGATAAT 


TGCCTTATTT TCATCTGTTT 


300 


GTAGTGACTT 


TAGTAATCTC 


ATTACTTGTC 


GTTTACTTTG 


TGGATCAAGT CCTGCTGTAG 


360 


GTTCATCAAC 


CACGATAATA 


TCAGGATTCA 


TTGCCAATAT 


CGATACAATC GCTATTTTAC 


420 
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AATCCATCAA CAGACGATGG GCATAGTTTT TGGCTTCATC TAAATTCATT TTAAAGTTTT 540 

TAGGTCCAAA TATCATTTCA CGCTCTACTG TGTCCTCAAA TAATTGAGAT TCGGGAAATT 600 

S GAAATACCAT TCCAATTCTT TTTCTTACAG GTCTAATATA TTTATCTTTG GTCTTATGTG 6 60 

TAATAGTAAT GTCATCAACT GTAACTGTCC CAGTAGTCGG CTTTAACAGC GCATTAATAT 720 

TTTGTATCAA CGTTGATTTA CCACTACCCG TTTGTCCAAC GATGGCGTAA TATTTACCTT 780 

W 

GTTCAAATTC TGTATTAACA TCATGAATAG CTTGATGCTG ATATGGTGTC CCTTTTTGAT 84 0 

AGGTATAACT TACATTGTCA AACCGTATAG TCATAGTTGA TCCACCAGCC CTTCATAAGT 900 

TAAGAATGAT GTTTGGTGTC CCAGCATTTG ATTTATTTTG ATTGGGAATG GCAAATCTAG 960 

15 

ACCTATTCTT GTTAACTCTT CTGCATTGTC GAAAATTTCA GTCGCTGTGC CTTCTTTATA 1020 

GACAGTCCCT TTATTCATAA CGATAACATG ATCTGCTTCC ATCGCCTCAG ATAAATCATG 1080 

20 CGTAATAGAA ATGATTGTAA TATTATGTTC TGATTTAACT TTTCTCACTA AATCCAATAA 114 0 

ATTTTGACGT GCATCAGGAT CTAACATAGA AGTCGCCTCA TCTAATATAA TGACAGAGGG 1200 

GTTAAGTGCT AATACACTTG CTATAGCCAC ACGCTGCTTC TGTCCCCCCG ATAAT GCATT 1260 

25 AGGTTCATAA TCTGCACGTT CTAACATATC AACTTGTTTA AGTGCTTCGC TGACTCTTCT 1320 

ATGCATTTCG TCATATGGAA CCGCATGATT TTCGAGTCCA AATGCCACAT CGTATTTTAC 1380 

AATTGAACCA ACAAATTGAT TATCCGGATT CTGAAATACA ATTCCTATGT CTTTTCTTAA 144 0 

30 CTTTTCAAAA TTATCATCAG TTATAGCTTG ATTATTATAA AAAATTTCTC CAGATTTAAC 1500 

TTTCTCTATG CCAATCATTA ACTTGGcAAT TGTAGATTTT CCAGAACCGT TATGACCAAC 15 60 

AATAGATGTC CACTGACCTT TAGGTATATT AAAAGAAACA TCTTTCAATG TGAAGGATGC 162 0 

35 ATCACTTTGA TATTGAAATG AAACATTTTT AAATACAATA ACTGAATTCT TATCCTCCAC 16 80 

TTGTCTCTCT CCTTTACGAT TCGTGTATCT ATCATATTTT ACAATATTTA TAAATCGCTG 174 0 

TATATGACAT TGACTGGGTT CTCTATATAT TACTAGTATT TTCTGACTCA TTTCTAGTCT 1800 

40 

TTAAAGTGTT GTTTAACAAC TAATGATAAG GACTTTTATT CCTCTCTAAC AATTATGTAT 1860 

AAACGTTAAT AAAATAAATG ATTTACTAAT ATAGGGGTGG TCGCGTTTGA TTCAACGATA 192 0 

ATACTTTCAC TTCATTCAGT TCTAGTGAAA TTGATCAAAC TAGCTTCATC ATATTTTTAG 198 0 

45 

ATTCGCACTC AAAAAAGTAA ATATAAAGAA ATCGGACTTA AAAACATTTC TGTTCATAAG 2040 

TCCGATATTT TATTCAATAA AAAAGCGCGC ACCCCATCAT AAGTTTG TTG AGTTCACGCT 2100 

so TTAAATCTTT ATTTAGTTGA TGGGGTACTC TGAGCTAGAC AATATTTGTA TGTGGCAAAC 216 0 

ATTAtCGTTG CACTCATTTG CTTTATATAA AAGTAGTTAG TGTATTTATA TAAATT CTTA 2220 
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ACGAGTGTAA CCACCTTGAC GTTCTGTGTA AcGCTCTGCG ATTTCACCAA ATAATTTTTG 23 4 0 

AAGTGCAGTT TGTGTAGTTT CATCTTCGTT TAAGATTTCA ACATTACGTA AAGTTTTAGC 24 00 

£ TGCATTACGA CGAGAAGCTA AATCTC CTTT TTTACCTAAA GTGATTAATT TCTCAACAAC 24 60 

ACTGCGAACT TCTTTTGCAC GAGCTTCTGT AGTTTCAATA CGTTCACTAA TAATAAGTGA 252 0 

TGTAGCTAAG TCACGTAACA TAGCTTTACG TTGATCAGAA GTACGACCTA ATTTTCTGTA 25 BO 

to 

ACCCATGAGT TAACCTCCTT TATCAATCTT CTTTTCTTAA TCCTAATCCT AAATCTTCTA 264 0 

ATTTGTATTT AACTTCTTCT AAAGATTTAC GACCTAAATT ACGCACTTTC ATCATGTCAG 270 0 

CTTCAGATTT GTCAGCTAAC TCTTGAACAG AATTGATTCC TGCGCGTTTT AAGCAGTTAT 276 0 

75 

ATGAACGTAC AGATAAGTCT AATTCTTCAA TAGACATTTC TAATACTTTT TCTTT TTG AT 282 0 

CTTCTTCTTT TTCAATCATG ATTTCAGCGT TTTGCGCTTC ATCAGTAAGA CCAACGAAGA 2880 

2o TATTCAAGTG TTCAGTCATT ATTTTTGCTG CTAATGAAAC TGATTCTTGT GGTGTGATTG 2 94 0 

AACCATTAGT CCAAACATCC AATGTTAATT TATCAAAATC ACTGCTTTGA CCTACACGTG 3 00 0 

TATTTTCAAC AGTATAGTTC ACACG TT CAA CAGGTGAATA CAATGAATCA ACAGGGATTA 3 060 

25 CACCAATTGG TAAATCACTA GTATTATTTT GTTCTGCTAA TGCGTAACCT CTACCCTTGT 3120 

TAG CAACTAG ACGAATTTTT AAGTGACCAC CTTTAGATAC TGTTGCAATT TTAAGCTCTG 3180 

GGTTTAAAAT TTCAACATCA CTATCATGTG TAATGTCGCT TGCTGTTACT TCGCCTTCAT 3 24 0 

30 CACGTACATC AATTTCTAAA GTTTTATCTT CTTCAGAGTA AATTTTCAAT GCTAATTGTT 3300 

TAATGTT CAT AATAATTGTA GAAACATCTT CAACTACATT GTCTACTGCT GAGAATTCAT 3360 

GTAAAACTCC CTCAATTTCA ATATACTTAA cGGCTGCACC TGGTAATGAA GATAGTAGGA 3420 

35 TACGACGTAA GGAGTTTCCT AGTGTAGTAC CGTAGCCACG TTCTAGTGGT TCAACAACGA 3480 

ACTTACCGAA TTTAG CATCT TCACTAATTT CAATTGTCTC AATTCTAGGT TTTTCGATTT 354 0 

CTATCATTTA AATATCCTCC TTATATACGT CGACTTAATT TAAAATGTTT GCTCAGTGAC 3600 

40 

CTGTAACAAT ACCATCATAA ATTATACACG ACGACGTTTT GGTGGACGAC AACCGTTATG 3 660 

AGGTACTGGA GTAACGTCTC TGATCGCAGT TACTTCTAAA CCTGCAGATT GTAATGCACG 3720 

AATAGCTGAT TCACGACCTG GACCAGGTCC TTTAACTGTT ACTTCAACTG TTTTTAAACC 3 780 

45 

ATGCTCCATA GCTGATTTAG ATGCAGTTTC AGAAGCCATT TGTGCTGCAA ATGGTGTTGA 3840 

TTTTTTAGAT CCTTTGAATC CTAATGCACC AGCTGATGAC CATGATAAAG CATTACCGAA 3 900 

gg CTCATCAGTG ATAGTTACAA TAGTGTTGTT GAATGTTGAA CGGATGTGTG CTACAC CATT 3 96 0 

TTCAATATTC T TTTTCACTC TACGTTTACG AGATACTTGT TTACGTGCCA TTTAAAATTT 4 020 

55 
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CGCGCGTkGT TTTTCGTTTT TTGACCACGA ACTGGTAAAC CACGACGGTG ACGGATACCc 414 0 

AC GGTATGAT GAAATTnCCA TTAAAcGTTT GATATTTAAG TTAGTTTCAC GACGTAAGTC 42 00 

ACCTTCGACT TTATAACCGT CTACAACTTC ACGGATGCGA CCTAATTCGT CATCAGTTAA 4 2 60 

AT CTTTCACA CGAGTATCAG CTGATACGTT AGCTTCTTCA AGAATTTTTT GAGCAGTTGA 4 3 20 

CGTACCGATA CCGTATATAT AAGTTAATGA GATAACTACG CGTTTTTCAC GTGGAATATC 43 80 

TACTCCTGCA ATACGTGCCA TATTAATTTA CACCTCTCTT TTATTAACCT TGTCTTTGTT 44 4 0 

TGTGTTTTGG ATTTTCACAA ATTACCATTA CTTTACCTTT AC GTTTAATG ACTTTACATT 4 5 00 

TTTCGCAAAT AGGTTTTACT GATGGTCTTA CTTTCATTTT TATACCTCCC TATATTATGG 4560 

AGTGACGATT ATTTATAACG ATAAGTAATT CTTCCGCGTG TTAAATCGTA CGGAGACATC 4620 

TCAACAGTTA CTTTGTCGCC AGGTAGAATA CGAATGTAAT TCATTCTGAT TTTAC CACTT 468 0 

ACGTGAGCnA AAATCTCATG ACCATTTTCT AATTCTACTT TAAACATTGC GTTCGGTAAA 4 74 0 

GTATCTAATA CAGTACCTTC TAATTCAATT ACATCTTGTT TAGCCATTGA TTAACTTCCC 4 800 

CCTTTTTGCA ATAGTAAGGT AATCGTCAAT AGACAACTTT ATTGTTACGA ATCTATCAGT 4 860 

GATTAATTTT ATAAGTTAAA CAAAAATTAC GGGAATTAAT TATCGTTAAT TGCCACTCTC 4 92 0 

ATCTATCTAA TATGATTAAA TCATGCCTCA CTTAAAATAG ACCGCTAAAA GTTGATCTAT 4 98 0 

TACAAATGAT CTAAAATATC AATGACATCT TTGGTAACGT CGCTAATATC TTTTGAACCA 504 0 

TCAATATTTT TCAATACACC TTTTTGATCA TAGAAATCTA AAATAGGCTT AGATTG TTTA 5100 

ATATTAACAC TCAAACGATT AGCTACCGTT TCAGGATTAT CATCTTCTCG TTGATA CAAT 5160 

TTACCACCAT CGATATCACA AATACCTTCG ACTTCGGAGG ATTAAATACA AGATGATACG 5220 

TTGTACCACA TGACTCACAG ATTCGACGAC CTGTAAGACG GTTCATTAAT TCTTCTTCCG 5280 

GAACTTCGAT ATTGATGACA GCATCAATGT TTCTGTCAAG CTCAGACATA ATATTATTTA 53 4 0 

ATGCCTCAGC TTGCTCGATT GTTCTTGGGA AGCCATCTAA TAAAAAGCCT TTTTTTGCAT 54 00 

CGTCTTCAGA AATTCTTTCC TTAACGATAC CTACAGTCAC TTCATCAGGA ACTAATTCGC 54 60 

CACGGTCCAT ATAAGACTTA GCTTCTTTAC CTAATTCAGT TTCTTCTTTT ATAGCTTTTC 552 0 

TGAACATGTC AC CAGTTGAA ATGTGGGGTA TTGGGAATTT CTTGa CAATT TCACTTGCTT 5580 

GAGTTCCTTT ACCTGCGCCA GGTAAACCCA TCAAAATGAT ATTCATAAGT GCCCTCCTAA 564 0 

AATTATCTAC CACCAAAGCC TTTATATTCT TTTTGAGATA CTTGAGCTTC TAAAGATTTC 5700 

ATTGTTTCAA TCGCTACACC AATAACGATA AGTAAACTTG T AC CAC CAAT CTGAATTGAT 5760 

TGTGGTAATC CCATAAACTT AGTTGCTAAT ATCGGTAGAA TTGAAATAAC GGCTAAGAAG 5820 



EP0 786 519 A2 



CCAGGTCTAA TACCTGGAAC ATAGCTACCT TGTTTCTTAA GGTTATCAGC CATTTTTTCC 5 94 0 

GGATTAACTT GTACAAATGC ATAGAAGTAT GTGAATAGTA TAATTAGTAC AATATATACA 6 00 0 

5 ACCATACCAA CATTACTTGA AG GATTTG CA GCATTCG CAA TGTTTTGTGC CCATTCTTTA 6 060 

TCTGGATAGA ACAACGTTAA TGTTCTAGGC AGTAAGAAGA ACGCCATTGC AAAGATTACA 612 0 

GGAATAACAC CGGCTGAGTT CACTTTTAAA GGTAGATAAG TTGCCTGTGA ACCTAATCTT 6180 

W 

TG AG CAGTTT GTTTCTTAGC ATATTGAATC GGAATTTTAC GAACGGCTTC AAGTACATAA 6 24 0 

ATAGCACCTA CAGTTAATAG TATCAGTGAC ACTAAAAGTC CTAATACTTT CAACCATGCT 63 0 0 

AATGATGTAT CTTCTTGCCC AACGAACGCA tTTGTcCAAA TTGAATTAGA CTGGCTGGCA 6 3 60 

15 

ACGTTGATAA AATACCCGCA AATATGATAA TAGAAATACC ATTACCAACA CCGAACTGAG 64 20 

TGATTTGATC ACCAAGCCAT ATTAAGAAAG CAGTTCCTGC TGTnCAAAAC TAGTGCTATT 64 80 

20 AATAAATAAC TCATAATTGA CTGATTGATA ATCAGCG CAC CTTTGAGATA ATTATTAAAT 654 0 

TGGAATGCCA TACCTATAGA TTGGATAAAT GCTAAAGAAA TTGCTAAATA ACGAGTAACG 66 00 

TTATTTAACT TTCTTCTACC TACTT CACCT TGTTTTGCCC ATTCTGAGAA TTTAGGGACA 666 0 

25 ATATCCATTT GTAATAATTG CATTACGATT GATGCAGTGA TGTAGGGTAC AAT AC CC ATT 6 72 0 

GCAAAAATAG AAAATCGTTT c AAGG CTCCG CCACCAAAAG TATTTAATAA CTCAGTGGCA 6 780 

CCTTGAGAAC CTTGGGGATT ATCAAAAGCT GCAGGATTTA CTCCTGGAGC TGGTATATAA 6 84 0 

30 

GTCCCTATTT TAAAAATTAC TAACATTGCT AGTGTGAAGA AAATCTTGTT ACGAAC CTCT 6 90 0 

TTTGTTCTAA AGAAGTTCAC AAGGGTTTGA ATCATTAGAT CACCTCGTGT GcTCCACCTT 6 96 0 

TAGCATCAAT AGCTTCTGCT GCTGAAGCTG AGAATTTATG AGCTTTCACT GT CAATTTCT 702 0 

35 

TATCAAGTGA ACCATTACCT AG T ATTTTG A TACCAGATTT TTCATTCTTA ACAACACCAG 70 8 0 

ATTCTACTAA TAAAGCTGGA GTTACTTCAG TACCATCTTC AAATTTATTA AGTTGGTCTA 714 0 

40 AG TT AACAAT AGCATATTCT TTACGATTTA TGTTAGTAAA ACCACGTTTT GGTAAACGAC 72 0 0 

GGAATAATGG TAATTG AC CA CCTTCAAATC CTGGTCTTAC ACCACCGCCT GAACGAGCTT 72 6 0 

TTTGACCTTT GTGTCCGCGA CCACTTGTTT TACCGTTACC TGTCGCAACA CCACGTCCAA 73 2 0 

45 CACGATTGCG TTCTTTACGT GAACCTTCTG CCGGTTTTAA CTCATGTAAT TTCATTTCGG 73 8 0 

CACCTCCTTG ATTATTTTTC TTCTACTGTT ACTAAGTG CT TAACTTTGTT GATTTGCCCA 744 0 

CGAATAGCAG GGTTATCTTC AACAACTACT GAACTGTTAG TCTTTTTAAG ACCTAAAGCT 7 50 0 

50 

TCAACAGTTT TACGTTGTGT TTCAGGACGA CCAATAACAC TACGAGTGAG GGTAATTTGT 7 56 0 

AATTTAGCCA TAACTAGTTT TCCCTCCTTA ATTGTATAAT TCTTCTACTG TTTTGCCACG 7620 
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CATGTTGATT GGTGTGTTTG ATCCTAATGA TTTACTTAAG ATATCAGTGA TACCTGCTAA 774 0 

TTCAAGTACG GCACGAACAG GACCACCAGC GATAACTCCT GTACCAGGTG CAGCCGGTTT 78 00 

S CATAAAT AC G CTTCCTGAAC CGTAACGGCC AGTAATTGTG TGTGGAGTTG TACCTTCAAC 7860 

ACGTGGAACA ACTACTAAAT CTTTTTTAGC TGCTTCAACA GCTTTTTTGA TTG CTTCTGG 7920 

TACCTCTTGA GCTTTACCAG TACCGAAACC TACACGACCA TTTTTGTCTC CAACTACAAC 7 980 

w 

TAATGCAGTG AAACGGAAAC GACGACCACC TTTTACAACT TTTGCTACAC GGTTGATTGT 804 0 

AACAACGCGT TCTTCAAATT CTTTCGTCTC TTCTTCtCTA CGAGCCATGT ATTTGTCCCT 8100 

CCTTTAAATT AAAATTCTAA TCCGCTTTCT CTTGCTGCTT CAGCTAATGC TTTAAcACGT 816 0 

15 

CCGTGATATA AATATCCTCC ACGGTCAAAT ACGATTTCTT TAATGCCTTT GTCAGCAGCT 822 0 

TTTTTAGCAA TTGCTTCACC GACTTTAGTT GCTAATTCAA CTTTAGTTGC TGTAGTAGCA 8280 

20 ATGTCGCTGT CTTTTGAAGA AGCTTGAGCT AATGTTACGC CTTTATTATC ATCAATAATT 834 0 

TGAGCGTAGA TATGCTTGTT TGAACGATAT ACGTTTAAAC GTGGCTTTTC AGCTGTACCT 840 0 

GATAAGTTAG TACGAACACG AG CATGTCTT TTTAAACGCA CTTTATTTTT ATC AATTTTA 84 6 0 

25 CTGATCATTT CAATACTCCT TTCTTTAGAG TTTATCTATT ATTTAC CAGT TTTACCTTCT 852 0 

TTACGGCGAA CGTATTCACC TTGGTAACGA ATACCTTTAC CTTTGTAAGG CTCTGGAGGT 858 0 

CTTACTGAAC GGATGTTAGA TGCTAATGCT CCAACTTGTT CTTTTGAAAT ACCTTCAACT 864 0 

30 TTAACGACTG TGTTTTTCTC AACTGAGAAA GTAATGTTTT CTTCAGCTTT AATTTCTACT 8700 

GGGTGAGAAT AACCAACGTT AAGGATTAAG TCTTTACCTT GCATTTGAGC ACGGTAACCT 8760 

ACACCAACAA GTTCAAGTAC TTTTACGTAT CCTTGAGAAA CACCTTGTAC CATATTGTTT 8820 

35 

AATAAAGCAC GAGTTGTACC ATGGTTTGTT CTATCTTCTT TAGAATCAGA TGGTCTTACA 8880 

ACTTCAATTG TGTTTTCTTC TTGTTTGAAT GTCATTCTTT CATTTAAAGT TCTTGATAAT 894 0 

4o TCACCTTTAG GACCTTTAAC AGTTACATGA TTTCCATCAA AAGTTACTGT TACGT CACTA 900 0 

GGGATGTCAA TAATTTTCTT ACCAACACGA CTCATGTTAT GGCACCTCCT TATTTTTTAT 906 0 

TACCAAACGT ATGCGATAAT TTCTCCACCA ACATTACGTT TTCTTGCTTC TTTGTCAGTG 9120 

45 ATTACACCTT CAGAAGTTGA TACTAATGCA ATACCTAAAC CATTTAATAC TTTAGGCATT 9180 

TCGCTAGCTT TTGCATAAAC ACGTAAACCT GGTTTTGAAA TACGTTTTAA TCCTGTGATA 924 0 

ACACGCTCAT CGTTTTGACC ATATTTTAAG AATAAACGAA GTACACCTTG TTTATCATCT 9300 

50 TCTACGTATT CAACATTTTT AATGAAACCT TCACTCTTTA AGATTTCAGC AATTTCTTTT 9360 

TTAATATTTG ATGCAGGTAA TTCTAACTTC TCGTGACGCA CCATGTTTGC GTTTCTTACA 9420 

ss 
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TCTTTT TT AT TACCAGCTAG CTTTACGAAC GCCAGGGATT TGGCCTTTGT AAGCTAATTC 9 54 0 

ACGGAAACAA ATACGGCATA ATTTAAATTT ACGATATACA G AATG TGGAC GGCCACAACG 9 600 

TTCACAACGA GTGTATTCAC GAACTGCATA TTTTTGTTTT TTTTGTTGCT TAGCAACCAT 96 60 

TGAAGTTTTA GCCACTTAAT TAGCCTCCTT TAAATAATTA TTTACGGAAT GGCATACCGA 97 20 

AGTTAGCTAA CAATTCACGA GCTT CTTCAT CAGTGTTAGC AGTCGTTACG ATAACAATAT 97 8 0 

CCATTCCTCT AACTTTACTT ACTTTATCAT AGT CGATTTC TGGGAAAATT AATTGTTCTT 98 40 

TAA CACCTAA AGTGTAGTTA CCGCGTCCGT CAAATGCTTT TTTAGAAACA C CTTGGAAGT 9 9 00 

CACGTACACG TGGTaATGAT ACTGAAATTA ATTTGTC TAA GAATTCATAC ATTCTTTCAC 9 9 60 

CGCGAAGTGT TACTTTCGCA CCGATTGGCA TACCTTCACG TAAACGGAAA GTCGCGATTG 10020 

a TTTTT TAGC TTTAGTTACT AATGGtTTTT GAC CAGTGAT CAATTCTAAT TCTTCAACAG 10080 

CATTGTCTAA TACTTTAGAA TTTTGTACTG CGTCACCTAC ACCCATGTTC ACAACGATTT 10140 

TATCTATTTT TGGTACTTCC ATTACTGAAC TATAATTGAA TTTTTTCATT AAGTTTTCAG 10200 

TAACTTCAGT GTTaAAC TTT TCtTTTaAAC GGTTCaAAGT GGGATCCTCC TTTCaACTTG 10260 

TtATTAATTA TTAGAkTTAA TTTCTTCGCC AGATTTTTTA GCGATAC GAA CTTTTTTACC 103 2 0 

ATCAACAAAT TTGTAACCTA CACGAGTTGG TTCGTTTGTT TTAGGGTCCA ATAATTGTAC 103 8 0 

ATTAGAAACA TGGATTG CTG CCTCTGTTTC TAAGATTCCA CCTTCAGGAT TTAATTGAGT 104 4 0 

TGGTTTTTGG TGTTTTTTCA TAATGTTAAC ACCTTCCACA ACGACACGGT CTTTTTTAGG 10500 

TAGAGTAGCA ATTACTTTAC CTTCTTTACC TTTGTCTTTA CCTGCGATAA CTTTAACGTT 10 560 

GTCACCTTTT TTGATATGCA TGTGGGCACC TCCTTATTTG TATTGGTTGT TATTAATTAA 106 2 0 

AGTACTT CTG GTGCTAATGA TACGATTTTC ATGAAGTTAC CTTCACGTAA TTCACGAGCA 106 8 0 

ACAGGTCCGA AGATACGAGT ACCACGTGGG CCTTTGTCAT CACGGATGAT AACACATGCA 10740 

TTTTCATCAA ATTTGATGTA TGAACCGTCA TTACGACGAA CAC CTGACTT AGTACGTACG 10800 

ATTACAG CTT TGACAACGTC ACCTTTTTTA ACAACGCCAC CTGGTGTTGC ATTTTTAACA 1086 0 

GTACATACGA TAACATCGCC GATGTTTGCT GTTTTACGAC CAGATCCACC TAATACTTTG 10920 

ATTGTAAGAA CTT CACGAGC AC CAGAGTTG TCTGCTACTT TCAAGCGTGT TTCTTGTTGG 10980 

ATCATTAGTT AAACCTCCCT TATCTCTAAA CTTGTATTAA ATAATTACTG ACTCTTCAAC 11040 

AATCTCTACT AAACGAAAAC GTTTTGTTGC TGATAAAGGA CGAGTTTCTT GAATTTTAAC 11100 

AATGTCTCCT AATTTAGCTG AATTGTTTTC ATCATGAGTT TTGTATTTTT TAGAGTATTT 11160 

TACTCGTTTA CCGTATAATT TGTGTGTTTT GTAAGTTTCA ACAAGTACTG TAATAGTCTT 11220 
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TTTTGTAACC TCCTCTTACT 
CGAGCAACAG TTTTTAGACG 
TCTAATTGAC CTGTAGCTAA 
ATTTGTTCTT CGATTTCTGA 
ACCACCCAAT TCCTCACGTT 
ACGTAGTGcT TCACGCGCAA 
TGGTTTAACA ACTGCGATCC 
TAAAGGTTTT TTAGTATATG 
TTTCATGTAA CGTGTCATTG 
CGTTGTTGTA GCTTGTAAAC 
CCAGTTGTTT TAGGACGATG 
ATTTTCCTCC TCCACTAGTG 
TAACGCCTAA TTTACCGTAA 
GTAACGTATG AAGTGGAACA 
CGCCTAAACG ACCAGATACT 
TGATTGCTTG TTTTTGTACA 
TTTCAGCTAC TAAACGAGCG 
CTTTTTTATC AGTTAACGCA 
TACCAATTAC CATACCAGGT 
GTTCAATCTC TACGTGAGAA 
TTTTTAAATC TTCGTGTAAA 
AATCACGGAT AATACCAACA 
CTCCTTAAAA GTTAATTAAG 
AATGTGGCTT GTACGTTTGT 
TTTTAATGTT GGTCCTTCGT 
GTCATAGTTA TGTTCAGCAT 
TGAAGCTTTG TTTGTTAATT 
TAAGT CAAGA ACTAGTCTTA 
TGCTTCCATT AGGATGTCCT 



TAATTATTGA 
TGCAATCGTT 
CTGAAAGCGT 
AGTGGTTAAG 
TTACAAACTT 
CTTCTTCAGA 
AGCCTTCAAC 
GTGTATGTGG 
CTATACGAGC 
CAAACTCACC 
TTGACGACGA 
TTCTTAGTAG 
GTAGTGTCAG 
GTTCCTTCTG 
TGaGTTTTGA 
CGACGGAATG 
TCAAGATCAA 
TTTAATTTGT 
TTACCAGTAT 
ACTGATGCTT 
AGTGAAGCGA 
CGAAGTCCGA 
CTTCTTTAGC 
TAATCGCACT 
TAGCATATGC 
TAGCTAAAGC 
TTAAAATTGC 
CTTTACGAGG 
CCTCTACTTA 



TTAGCCTTAC 
TTTCTTACTG 
AGGTTAAAAA 
TCTCTAATTT 
AGTTTTTACT 
AACGCCAGCA 
CGCACCTTTA 
GAAGATTTTA 
AGATTCGATT 
AAATGTTACG 
TATTTTACAC 
GAAGAACTTC 
CTTCAGCGTG 
AATATTGTTC 
TACCTTTAGC 
AAGCACGGTT 
CTTTTTTGAT 
TGCGTAATTT 
GAATTGCAAT 
CTTTTAATTC 
AGTCTTTTTC 
TTGGATTAAT 
TTCTTCTTTA 
TGCACGACCT 
TTCTTTAACT 
GGACATTAAT 
AATAGCTTCA 
TGCGATTCTT 
ATAGATATTA 



TTTGTTCAAT 
TACGAATACG 
GCTCTTCTTT 
CCTTAGCTTT 
GGAAGTTTGT 
ACTTCGAATA 
CCAGCACCCA 
ATC CAAACTT 
TGACGAGATG 
TAtTACCGCC 
GTTTTGGTAG 
TCCACGATAA 
tGCATAATCG 
AGCACGAGCG 
ACCAAGTTTC 
TTCTAATTGA 
TTCAATTACG 
TTCGATTTCT 
GTTGATACGG 
ATTATCAATA 
AGCATACCAT 
TTTTTGACCC 
CCGTCACTTA 
TGCGCACGTG 
ACTAATTCAT 
ACTTTTTCAA 
GCAGCATTTT 
ATTGTTCTAG 
TCTTCTTGTT 



TTCTCTTTCA 
TGCAGTTTCT 
TGAAGATTTG 
CATTTGTTTC 
GACTTGCTAA 
AAATTCTACC 
TACGTACTTC 
TCCCGCCACG 
TGATCCAAGA 
TTTAGAACGA 
TAACATTATT 
ATCCATACTT 
ATGTCAGCAC 
ATGTCAGCTC 
ATAGCTCTAG 
CGTGCGATGT 
TTGATGTGTA 
GAACCGCCTT 
TTTGCAGCAC 
AATTTACGGA 
TTAGCTTCCC 
ACAGTATTCC 
CGACGATTGT 
GACGGAAACG 
CTGTGTTCAT 
TTACTGGTGA 
TACCTCTGAT 
CAACCGCTTT 
TTCTTGTCGT 



11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
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TATCTTCAGT TACATATACA GGTACGTGTT TACGTCCGTC GTATACTGCA AAAGTATGTC 1314 0 

CGATGAAATT AGGGAAAATT GTAGAACGAC GTG AC CATGT TTTGATTACT TGTTTCTTTT 13 2 00 

5 CGCTTCCTTC TTGAGCTTCA ACTTTTTTCA TTAAATGCTC ATCGACGAAA GGTC CTTTTT 132 60 

TAATACTACG AGCCATTTGG GCGCCTCCCT TCTTATTATG TGCGTGCAGC TTTAAGCCGC 133 2 0 

ACACCCAAAT AAGTTGATTA TATTATTTTT TCTTACGTCC ACGAACGATA AGTTTGTCTG 13380 

ATGATTTTTT ACCACGACGA GTTTTCTTAC CAAGCGTAGG TTTACCCCAT GGTGACATTG 13440 

GAGATGGTCT ACCGATAGGA GCACGACCTT CACCACCACC GTGTGGGTGA TCGTTAGGGT 13 500 

j5 TCATTACAGA ACCACGAACT GTTGGACGGA TACCTTTCCA TCTTGAACGT C CGGCTTTAC 13560 

CAACG TTAAC TAATTCGTGT TGTAGGTTAC CAACTTGACC GATTGTAGCA CGGCAAGTAG 13 62 0 

ATAAGATCAT ACGAACTTCA CCAGATCTTA ATCTGATTAA TACGTATTTA CCTTCTTTAC 136 60 

20 CAAGTACTTG AGCACTTGCA CCAGCTGAAC GAGCGATTTG TCCACCTTTA CCAGGTTTAA 13740 

GCTCGATGTT GTGTACTACT GTACCAACTG GAATGTTTTG TAATGGTAAT GCGTTACCAA 13800 

CTTTGATGTC AGCTTCAGCA CCACTTTCAA CGATTTGACC TACTTC TAAT CCTTTAGGAG 13860 

25 CAATGATATA TCGTTTTTCA CCGTCTGCAT ATACAACTAA AGCGATGTTT GCTGAGCGGT 13 920 

TTGGATCATA TTGAATAGAA TCAACTTTTG CATTGATACC ATCTTTGTTA CGTTTGAAAT 13980 

CGATAACACG GTATTGACGT TTGTGTCCAC CACCATGGTG TCTTACAGTC AATTTACCTT 14040 

GGTTGTTACG TCCCGCTTTT TTCGGTAGCG GTTTTAATAA TGACTTTTCA GGTGTAGTTT 14100 

TCGTGATTTC TGCGAAATCT AACGAaGTCA TATTACGACG ACCATTTGTT ATTGGCTTAT 14160 

ACTTTTTAAT AGCCATTGTC GCTTACCTCC TTAATGGTAA TTGTTTTATT AGTTAAATAA 14 220 

35 

GTCGATTGAT CCTTCTTTAA GAGTTACAAT CGCTTTTCTT CTTTTGT TTG TATAGCCTTG 14280 

GTAACGGCCC ATACGTTTTT TCTTAGGTTT GTAATTCATG ATATTAACAC TTGCAACTTT 14340 

4Q TACGTTGAAG ATTTCTTCAA CTGCCATTTT TACTTGTGTT TTGTTAACAC GAGTATCAAC 144 00 

GTCGAAAGTG TATTTGTCTT CAGCCATTGC TTCAGAAGAT TTCTCAGTGA TTACGGGGCG 144 60 

CTTAAGAATA TCTCTTGCTT CCATTATCCG AGCACCTCCT CAACTTTTTT AGCAGCAGCT 14 520 

45 TCAGTAATTA CTAAGCTGTC AGCATTAGTG ATATCTAAAA CATTTAAACC TTGAGCAGTT 14 580 

GTCACTTGAA CGCCAGGGAT GTTGCGTGCT GATAATTCAA CATTTACATC TTCGTTTTCA 14 640 

GTAACTACTA ATACTTTTTT AGGTTGTTCT AATGTAGATA ATACATTTTT GAATTCTTTA 147 00 

50 GTTTTTGGAG CTTCGAAGTT GAATGCGTCA ACTACAGTTA AGCCATTCTC TTGAG C TTTG 14760 

AAAGATAATG CTGAGCGTAA AGCTAAACGA CGCATTTTCT TAGGCATTTT GTATGCATAA 14820 
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CCTTGACGAG CACGACCTGT TCCTTTTTGC TTCCATGGTT TACGTCCGCC ACCGCTTACT 14 94 0 

GCTGAACGAT TCTTAACAGC ATGCGTACCT TGACGTAATG AAGCACGTTG TAAATTAATA 15000 

£ 

GCTTCGAATA AAACGCTATT ATTTGGCTCA ATACCGAATA CTGCATCGCT TAATTCG ATT 15 060 

GAACCTGATT TAGTTCCGTC TAATTTTAAA ACATCATAAT TAGCCATTAT GCATTTCCTC 15120 

CTTTCACTTC TTATTATTTA TTACCTTTTT TAATTGAAGT TCTGATTTCT ACTAAACCTT 15180 

TTTTAGGTCC AGGTACGTTA CCTTTTACTA AGATAACTTT GTTTTCTGTG TCAACTTGAA 15240 

CTACTTCTAA GTTTTGAACA GTTACAGTGT TTCCACCCAT ACGTCCTGGC ATTTTTTGGC 153 00 

, s CTTTAAATAC TCTAGAAGCA TCTGAAGCCA TACCTACAGA ACCTGGTGCT CTGTGGAAAT 15360 

GAGAACCGTG TGACATAGGT CCACGAGATT GTCCGTGGCG TTTAATTGCA CCTTGGAAAC 15420 

CTTTACCTTT TGATACGCCT GTTACGTCAA TAACGTCGCC AGCTACAAAA GTATCTACTG 15480 

20 AGACTTCTTG AaCCTAcTcG TAAGCATCCA CGTCTACATT GCGGAATTCA CGAATGAAGC 15540 

GCTTAGGTGC TGCGTCAGCT TTTTT AGCGT GACCTTCAGC TGGTTTATTA GCATATTTAT 15600 

TAGATTTTGC ATCTTTTTTG TATGCTTTTT TGTCTTCAAA TCCAACTTGG ATTGCGTTGT 1566 0 

25 ATCCATCAAC TTCTACAGTT TTCTTTTGTA ATACAACATT TTCTTTAGCT TCTACTACTG 1572 0 

TTACAGGGAT TAATTCACCG TTTTCTCCGA ATACTTGT GT CATCCCAATT TTTCTTCCTA 157 8 0 

AGATTCCTTT GGTCATCGAA AGTCCACCTC CTAAAATTGT CTATTATAAT TTGATTTCGA 1584 0 

TGTCTACACC AGATGGTAAG TTTAAGCCCA TTAAAGCGTC AACTGTTTTT GGTGTTGGGT 15 900 

TTACAATATC GATTAAACGT TTGTGTGTAC GTTGTTCGAA TTGTTCACGT GAATCTTTAT 15 960 

ACTTATGCAC GGCACGGATG ATTGTGTAAA CTGATTTCTC AGTTGGTAAC GGAATTGGTC 1602 0 

35 

CAGAAACATC TGCACCAGAA CGTTTCGCTG TTTCTACAAT CTTCTCTGCT GATTGATCAA 16080 

TTACGCGGTG ATCATAAGCT TTTAAT CTGA TTCTGATTTT TTGTTTTGCC ATAATTTTCC 1614 0 

40 CTCCTTATTC GTCTACATTT AGTGATAGAC TTCTCCACGA AAACTATCTT ACACAGCGCC 16200 

ATGGCAAAGC GGCCGGGTGT GTCAGTAACC TTTCGCTTCA TCGCTTTTCT TAAAGTC CAA 162 60 

CGTTAGTTAT ATTACACGAA AAACAT CG AT AAATCAAGGC TTTTCACATA ATTTTTCTAT 1632 0 

45 CTGTCTAACA CATACTTTTA TATTTnACTT TATATACTTA GTCAGTTCAA CTATTTTCGA 16380 

GATATTTTnA ATTTCCn 16397 
(2) INFORMATION FOR SEQ ID NO : 206: 

50 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 29555 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 206: 

5 TnAGTTGTTT CTGCCACGAA AGATT CAATG GCTTTTCTTG CTTTACGCTT TTCTTTCAAT 60 

GGCAAATCAC CAATCATTTT TTTAAGGTGA TGTGGGTTTA CAACACCACT ATACTGGTAG 120 

TCATTTGAAn TTGTTTT TAG GGCTTGTTCA TCGATAGATC TCTCTCCAGC AAATCCTTTG 18 0 

w 

AACTCCGCTT CTTTTTTAAT ACTTTCGAAA TTAACATATT CTTGATCGAT ATCATCATCC 240 

TTATTTAAAG AAGGTACAAC ATTGTCGATG AATTCTCTAA TTAGATCTCG TTTTAACCTC 300 

j5 AATGtCGGAT CATCTGCATG ATCTAAAATG CGTCTAATTT GTTCTTGGTT ACGACGTTGT 3 60 

TCCGCTTTGT CTT CAAGATC AATTTGTCTC AATATATTCA TAATATAATT CACATTAATC 420 

GTATCATTAC GCATCATTTC TATTTCGAAA TCAATATCAT TTAAAATGGA TACTTTATTT 480 

20 TTCTCAGCCG TCGCTCTTTT TACTTGATCG TACACAGCTA AATATTTACT TTTATAGTCT 54 0 

TCATTCTCTT GTTCATCCAT TCCAATTTCA TCAATTGTAA ACT C AAACT C GTCAAATGCT 600 

TTTAAACGTA ATATTATTTT AGCTAATAAA CGATAAGCCT CAACAAAGCG CTTTAGCTCT 66 0 

25 TCTTCATCtT GaATGt CATC AAC CATGTGT GGTGTCGGCA CAATCATTTT AAGCTCACGA 720 

TAAGCGTCCA TAAATTCTTT TTTATACTCT T CATAACTGC GCATTAAAAT TGTATCCGTA 780 

TCATTTGTTT GTGAGAATAC TCTCAGTGCA TCGTCTGTCT CTTTTTTCAA GTCACGATAG 840 

30 

TTTACAATTT TACCAAATGG CTTTGATTCT TTTTCAACCC TATTTGTACG TGAATACGCT 900 

TGAATTAAAT CATGATACAT TAAATTCTTA TCAACATATA AAGTGTTCAG TACTTTACTA 960 

3s TCAAAACCAG TTAAGAACAT ATTAACAACG ATTAAGATAT CAATTTTACT ATCTTTAACG 1020 

CCCTTTTTAA CGTTTTTt GA AATATGATTA AAATACTCAT TAGTTGtGGC TGnTGaAAAA 1080 

TTCGTCTCGA ACTTTTTATT ATAATCACTA ATCATTATCT CTAATTTTTC ACGTGAATGA 114 0 

40 TATGGCACTT CACCATCACG ATCATCTTCA TTAGGTTTAA ACGTAAATAT ACCAGCTATC 1200 

GTTAACGGTT GTTCCAACTT TTTGTTAAGT CGCTTAAATG TCTCATAATA TTTAATAAGC 1260 

GCGTGAATAC TTTGGACTGT AAATATACTT GAATATTGAC GATTACGTGT ATATTTATCA 1320 

45 TGATTATTGA TGATATGTCG TGTTACTAAT TCCACACGTT TATCCGCTAA CCATACTTCT 1380 

TCCGTATCAA TTGCTTCAAC CATGCtGTTA TCTTCTGCTT TTAAAGCTTT ATTTTTAAAA 1440 

GTATTAATAT AGTCAACTGA GAAACCAAGT ACATTACCAT CATGAATGGC ATCTCTAATT 1500 

50 

AAATACGTAT GTAAGCATCT ACCGAAAATA TCTGCAGTTG TTCTACCATC TTGACTACTA 1560 

TTTTCTGGAA AACGTGGCGT ACCAGTGAAT CCAAAGTATT GGGCATTTTT GAAATGTTGT 1620 

55 
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ACTTTATTCG TTTTATACTG TTCTAATAAA GGGGCATTCC CTTGAATCGC TTTAGCCATT 174 0 

TTTTGAATCG T CGTT ACAAT AAGTGGCAAA CTTTTATCAT TTAGTTGGCG TACCAGTTGC 180 0 

GAGGTATTAA AAGTTTTGTC TACAGCACCC TTAGCAAATT TATTAAATTC CTCTTCTGTT 18 6 0 

TGACTATCCA AGTCTTTACG GTCAACCAAA AAGATAACTT TCTTAATGTC ATCTTGCTGT 1920 

GATAAAATCT GACTCGCTTT AAAAGAAGTC AACGTCTTAC CACTTCCAGT TGTATGCCAT 1980 

ACATATCCAT TATTCCCTGT CTCAGTCGCT TGTTGAATAA GTGCTT CTAC CGCATACACT 2 040 

TGATACGGAC GCATTGCCAT CAGTATTCTA TCTGTTTCAT TAATAATCAT ATAGCGCGAT 2100 

ATCATCTTAG CTAATTGACA AGGTCTCATA AATGACTCAG CAAACGATTG CAATGTATTG 216 0 

ATACGGTTAT TCTGTTTATC ACTCCAATAA AACATGTGAC TCTTCAATAG TTCGCTATCA 2220 

TTATTAGAAA AGTATCGCGT TTCAACACCA TTACTAATGA TAAACATTTG TATGTAGCGG 228 0 

AATAAGCCTG TGTAATTTTG TTTGCGGTAA CGTTTTACTT GGTTAAACGC CTCATTAATA 234 0 

TCAATACCTC GACGTTTCAA TTCAACTTGG ACAAGGGGTA GTCCGTTGAT TAATATCGTT 24 00 

ACATCATAAC GTGCTTTATA TGTATCCTCG ACAGATACTT GATTCGTCAC TTGAAACTTA 246 0 

TTTTTACACC AACTTTTCGT ATCTAAAAAC GACAAATAAA TCTCAGACTC ATCATCACGT 2520 

CTAAGTGGTA ATTTATCACG TAAAATACGG GCACTCTCGA AAATACTTTT TCCATCAATC 2580 

ATCGTTAACA GACGTTGaAA TTCTTTATCT GTTAaGGGAT TGCCTTCTAA TTTGTCCGCA 264 0 

TGACGCTCAT TTAAAATCGT TCTAAAATTA TCAAG CAATT GCTTATTATC ACGTATCGTT 2700 

ACTCTTTCGT AACCCAATTG TTCAAGTTGA TTCATCATTT CATTTTCTAA TGCGTATTCA 2760 

CTTTGGTATG CCATTCATAT CCCCTTCCAT ACACTTTCTA TTGCTCTAAA TATATCATAA 2 820 

ACTTTAATGA AAAATGTTTG TTTTTTATCT TCAAACGTAA ATTTATT CTA ATTTTATTGT 2880 

CTTATCTTTT AATATTTGTC TTTGAGGTAA GTCGTATACT AAAATTTGAA TACAAATAAT 2940 

CAAATCATTG ATAAATTTTT TGTCTACGAT TAATGGAGGG ACTTGAATGG TGTTAATTAC 3000 

CTATCAAATC ATTTTATTTT TTATTATTAG TCTAAGTTAC TATTTAACTT TAAATCATTA 3060 

CATGGCAGTC ACTGTAGGTA ACTTCACTTC AATATTCGGC ATGTTCGCAG CCATACTCTT 3120 

TATGTACTAC TACCTACTCT ATAAAAGTCC CGAATACAAT CAACGCAAAC GATTTAAACA 3180 

TTTCATTCAT ATCACTAATT TGATAATAAT TGCTTTTAGC ACCTTCGTAT TAGTTCATTT 324 0 

AG CATTAAAA TTATTCTTCA GCATTTAATT TCCATCTATG AAAAAAGCAA AGCTCAAATC 3 300 

TGAACTTTGC TTTAATTTGT CACGCCTTTA TCATTTTCAA AATAGCCTCT ATGCCAGTTT 3 3 60 

TACAAACTTG TAGCAACAAT TTTTCATCAA GCAACTGAAT CACATCAAAA ACTTCAATTG 3420 
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GTCGCAAGAT GCTTCCTGTA ATTATCAAGT 
ATCGCATGAT AATTTAATGC TACAAATCGA 
5 GCAAATAGTG ACGTTGTAGC CGCCATACGC 

AATGCATAGT CTGCAATTTG AGCCACTGGA 
GGAATACTGT AATGTGTGGC CACCTGTGCA 

10 

TTCGTCACAA AAATCATGCA ATCTCTATCA 
TGCGTTTCAT GTAATAACCT GACATTTAAG 

)s CCAATAGTCA AACTCGATGC GCCAAATCCA 

ACATCACAAA TTG CAT CAAT TTGCGCATCC 
TTCGTTGCTC TAGCAATCAT TTTATTTTTC 

20 TCTAAATGTG GATTGGTTGC AATATCTTCG 

TCTTGAAAAC CTTGATGTGT CATTTTCCGA 
TTCGTAACAT CTGCCAAATC ATTCACAGTC 

25 ATGTAATCAG CGATTATCTT TTCTGTCTTC 

TATAAAATAT TTGTCATCAT TAATCACCCA 
TTCCAAATAA ATATGTACAA ACGAATCCAC 

30 

AACCTAAATA CATATTATCT GAGATTAATG 
CTTTGGCACC AATATGTCCA ATTCCACCTA 

3s AAGCAGTTAA GAAAGGTCGA CCTAATGGCA 

TACCTAGGAA ACCAACTGGC AATGCACCTT 
TACATCTTAC CCAAAGTGCT AATGCGGCAC 

40 TTGGCAATAA GTAAGTAGCA CCTGATTGGT 

TATGATGAAG CCCTAACATA ACTAACGGTA 
ATACGCCACC AATACTAATA ATTCCGTTAA 

45 CTGCTAATGG CATAAAGATA AAGATAGTTA 

GCGTTACAAT AATATCAATC GCATTTGGCA 
TTAAAATCCA AACGGCAAAA ATAACGCCAA 

50 

CTCCAGTGAA GACATTCATT AAAATATTTT 
CACCAATCAC GCCACCAAGT CCTGGTGTCG 

55 



GCCATTTTCG ATTGGGTTAT ACAATCTAGA 3 54 0 

TAGTACAATA TATCTACCGT GAATAACTGT 3 600 

ATTTCATTTT CATCAGTTCT GCCATAAATC 366 0 

TTATTAGCTG TACTAGATAT AGTTATGATG 3 72 0 

ATTGACTGCA ATTCACTATG ACTACCTTGA 3 78 0 

TCATGCGTCG CAAATGTTGA CACAAGTAAA 3 840 

CCAATACGAG ATAACTTTTG AAAAAGATCA 3 9 00 

AATAAAAATA TTGTCCTGGc ATTTTTCAAC 3 960 

ATAATATTAG TAGCTACAAA TCGCATCGTA 4 02 0 

AAAGTTTCTA CAGATTCATT TTCAATCAAT 4080 

GGTAAGTATC GAGATATCGC AATCTTTAGC 414 0 

CTAAATCTAA CAATTGATGC TGTACTAACA 42 00 

ATATCAATGA TTTTATGTGG ATTCTTTAAA 4 2 60 

GTAAAATCAC TCAACTGCTT ATCAATGCGA 43 2 0 

ACAAATCTGT CTGTCGCATC GCCTTTGTCG 43 80 

CAGCATACGC AGCAAGTAAT CCTGCAATAT 444 0 

GTAATAGTGA CACACCACTT GGGCCTATTG 4 500 

TTACAGCGCC ACCAATACCA CCACCAATAC 4560 

AAGTCACACC ATAGATTAAT GGTTCTCCGA 4 62 0 

TTAAAGTATT ACGTAATGTT GTGTTGCGTT 4680 

CTACTTGTCC AGCACCAGCC ATCGCTGCAA 474 0 

TAATCATTT C TATATGAATT GG CGTAAAAA 4800 

GGAAGCTTGC ACCAATGATA AATCCACTAA 4860 

CTACTGAAAC TAAACTGTCT GAAACAAAAC 4 920 

ATAGTCCTAC AATCAACAAT GCAATAGTCG 4 980 

CAATTTTATG TAATCTCTTT TCGACAATAC 504 0 

TAATCCCACC TTGTCCAGGT TGCAATGGTT 510 0 

TACCAGCAAT ACCCGTTAAT AACGTTGTAC 5160 

CACCAAATTC TTTAGCCGCA TTAATACCAG 522 0 
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GCGTAATCCA AGCACCTGAA ATATAGCCTG CCACCATTAA GTTACT CAGT ACTGCTGCAA 534 0 

TACCACCAAT TAATCCAGCT C CAATAAATG CAGGAATCAA CGGTATAAAG ATATTGGCAA 54 0 0 

TTGATTTCAA TAC TTTATTC AACTTACCAT TCTTTTGTTT TGCTTTATGC GCTTCCTTAT 54 6 0 

TCGCCTTTGC TTTAT CAGCT GCATATGATT TATAGTCCAT TTTTTCACTA TCATTGTGAT 552 0 

GGTGTGGTAT TGGGTCACCT AGTTTAACAC CACTTAATTC CGC CATATGA TTAG CCACTT 5580 

TATTGatGTA CCAGGTCCAA CCACAACTTG AATGCGTTCA TCGTGTATAA CACCCATGAC 5640 

ACCATCAATA TGCCTTAGTT CTTGGTCATC TACTTTATTC TCATCTAATA CTTTAATACG 5700 

CACACGTGTC ATACAGTTCA TGACACTATC TATATTATCC ATACCACCTA CTGCAGCAAT 576 0 

AATTCGTTCT GCAAGTTGTT GTTCTTTGGT CATTTAAATC CCTCCTAAGG TTGTCTATCT 582 0 

CTGATTGCTC GTTTAAaATG TCACCATTGT TTAATAACCG TCTTGTTGCT TCTTCCTTAG 58 80 

AAATGCCACA CATACCCATA ACTGTCGCAA CTTTCACATC ATGCTCAGAT ACCTGATATA 5 94 0 

ACGCCATTGC TTCAT CATAT GTGATAGCAC ATATTTCTTG AATAATACGC ACTGAACGGT 6 0 00 

CGATCAGTTT TTGATTGGTT GCTTTAACAT CAATCATGAG GTTAT CGTAA ACTTTTCCGA 6 060 

CACCAACCAT TGTGATGGTT GAAATCATAT TTAAAATTAA CTTTTGTGCt GTACCAGACT 6120 

TTAAACGTGT TGAACCAGTT AATACTTCTG GACCAACTTT AACTTCTACT GGATAcTGCG 6180 

CAATTTCACT TATAACTGCA TGTTCATTGC ATGAAATAGA TACTGTTGTA GCACCGATTG 624 0 

TGTTAGCAAA TGTTAAACCG CCTATAACAT ATGGCGTTTT GCCACTCGCG GCAATTCCTA 63 00 

TAACGACATC TTTTGATGTT AAATCTATAT TTTTCAAATC TTCTTC CGCT AATTTTTTGT 6 3 60 

GATCTTCCGC ACCTTCTACA GCCATCGTCA TAGCATGTTG TCCACCAGCA ATAATACCTA 642 0 

TAATTTCATG AGGGTCAGTA TTGAATGTAG GTACACACTC CGCTGCATCT AAGACACCCA 64 80 

ACCTTCCACT TGTACCTGCA CCGATATAAA TCAATCGTCC ACCCTTTTTA TACTGTGCAA 6 54 0 

TTGTTTTTTT AATTACTTTT GTCAATTGTG GTATTGCCTT TCGAACTGCT AACGGGACTT 66 00 

GCTGATCTTC TTTATTCATC GTAATTAAAG CCTCTTCCAC AGTCATTTCA TCAAGATGCA 66 6 0 

TCGTCGCTTC ATTACGCGCT TCGGTCGTAC TATTTTCCAT CACTTCTTAC ACTCCCTAGT 6720 

TTTTTGAAAA TCAAATGTAT CATTCGGCTC GATACAACTT AACAGTGGTA AGTCTTCTTT 678 0 

AATAATTTGT GCAaCAACAT T CA CATTGTC ATGTGCACTA AGCGTTTGTC TCACAATTTG 684 0 

CATTTCGCCT TGATAACGTC CGTTATTCAA ATTATCAACG GTTACTGAAC CAATGCGTCG 6900 

TTGCGTCGTA AACTGTGGTT GAATCGAATG TGGACATATT TGTCTTGACG TTTCCGAACG 6960 

AATGACATTT TCCGGATTAT CCGGGCGTAC TTTATGACAC ATATCGAAAA GGTAAGTCAC 7020 
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AAGTTGTTTT GCCTGCCTCA TTTCAATCAA TGAGTCTCCA ACTAACACTT CAGATACACC 714 0 

AGTTTCTTGT AATAATTTAG CTGCAAC G AC AGGATGACTA TGTCTCGTTG CTTCAATTG T 7200 

5 TGGCAAGCCT TTATGCAAAG GACCTCGCAA ATCACTCCCT ACAATAAAAC CATATATTTG 7260 

TGCCTTTGGA TTAAATTGAT AAATGAGTTC ATTTTTCTTA TTGACCAAGT CAACAGATAA 73 2 0 

TCCCGTATCT GGTCTTGGAT AATAGTTATG ACAAAATGAA AGTAATGTAA AATCATTCAA 73 BO 

w 

TTGTTGATGT AAGCTTGTTA ACAATTCCCG GGAAATAATA CTTGCATTCA AACAGCACTT 744 0 

TAAACCCTGT GCCATTATCG CTTCGATTGC CTCAATTGAT GTACTATGAT CGATACGAAT 750 0 

J5 CATAAATTGT GCATCATATT GTCGAAGATG GTCATAAAAA GATGGTGTTA AAATAGATGG 7 56 0 

ATTAGCATCT ATGAGGTAAG TCACTTGTTC ATGTTTTAAT AAATTGAGTA GTTTTGTGAA 762 0 

ATAATGATAT TTTGT CTCGT CATCTTCTTC TGGTATTTGT ACAGATGTAA AAAT CATTTG 76 8 0 

zo GTAACCTTGT TTAATCATTC GCTTAATATA CGCTTCATCT AAAGGTTGTC CTAAATACAC 7740 

TGAAAAGCCT GTCAAAGTAG CCCTCCTTAA CAATATAATT ATTAGGAAAA TATAGTTGAT 780 0 

TTGTGTAATC GCTTACATTT TACTATAAGA GAAAACACAT TACAATATTA ATCAGTTAAA 7860 

25 GCCTGTTCAT TGTAATAATC TTACATATTT CTGTCACAAG TTAATTATTA CACCATCAAA 7920 

GATTATCCTT TCTTTTAAGT GCTGATAATA GCTGCTACTG CTGGATTATT ACAATAACTT 7 980 

TTATACATTT TATTCAGGAT TATCTTATAT TATGTTTTAA TAATAATCTG TGAACAATTA 8 04 0 

30 

AGAGATTTGA AATTGAATTT AATAATTGTA TTGAAAACGC ATACTTCACC ATGCTAAAAT 8100 

AGGAGTCGCA AACAAATAAG ATTCAATAAG ATGTGATGGT TACCAACACA GTCTATTTGC 816 0 

3S TCGTGTCTTT TTTTATTGAA TCTTAAATAA TAAATACAAC TTTGGAGGTT GGACAAGTGA 8220 

GGAAGAAACT TTTCGGTCAA TTGCAACGTA TTGGTAAAGC GCTAATGTTA CCTGTTGCGA 8280 

TTTTACCAGC AGCTGG TCTG TTATTAGCTA TCGGTACAGC TATGCAAGGT GAATCATTAC 8340 

40 AACACTACTT GCCGTTTATA CAAAATGGTG GCGTACAAAC TGTCGCTAAA TTAATGACAG 8400 

GTGCTGGTGG TATCATTTTT GATAACTTGC CTATGATTTT CGCATTAGGT GTCGCAATCG 8460 

GATTAGCTGG CGGTGATGGC GTAgcAGCTA TCGCAGCATT CGTCGGTTAC ATAATCATGA 8520 

45 ACAAAACAAT GGGCGACTTT TTACAAGTTA CACCTAAGAA TATTGGTGAT CCAGCGAGTG 8 580 

GTTACG CTAG CATTTTAGGT ATCCCAACAT TACAAACAGG TGTGTT CGGC GGTATTATAA 864 0 

TCGGGGCCCT GGCAGCTTGG TGTTATAACA AGTTCTATAA CATTAACTTA CCATCTTATT 8700 

SO 

TAGGTTTCTT CGCTGGTAAG CGTTTCGTAC CTATTATGAT GGCTACAACA TCATTTATTT 8760 

TAGCATTCCC AATGGCATTA ATTTGGCCAA CGATTCAATC AGGATTAAAT GCATTCAGTA 8 820 

55 
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TATTAATTCC ATTCGGTCTA CATCACATTT TCCACGCACC GTTCTGGTTC GAGTTTGGTT 894 0 

CATGGAAAAA TGCAGCTGGT GAAATTATTC ACGGTGACCA ACGTATCTTT ATCGAACAAA 90 0 0 

5 TTCGTGAAGG CGCACATTTG ACAGCTGGTA AATTCATGCA AGGTGAATTC CCTGTTATGA 906 0 

TGTTCGGTTT ACCTGCAGCA GCTTTAGCAA TTTATCACAC AGCTAAACCT GAAAATAAGA 9120 

AAGTAGTAGC AGGTTTAATG GGTTCTGCTG CTTTAA CAT C ATTCTTAACT GGTATTACAG 918 0 

AACCATTAGA ATTCTCATTC TTATTTGTAG CACCATTATT ATTCTTTATT CACGCaGTAC 924 0 

TTGATGGTTT ATCATTCTTA ACATTGTACT TATTAGATCT TCATCTAGGT TATACATTCT 9300 

)5 CAGGTGGTTT CATCGACTAC TTCTTACTCG GTATACTACC TAATAAGACA CAATGGTGGT 936 0 

TAGTCATTCC TGTAGGTCTT GTATACGCAG TTATTTACTA CTTCGTATTC CGATTCTTAA 942 0 

TTGTAAAATT AAAATACAAA ACACCAGGTC GTGAAGATAA ACAATCACAA GCGGCTACTG 94 8 0 

20 CTTCAGCAAC TGAATTACCA TATGCAGTAT TAGAAGCTAT GGGTGGCAAA GCAAACATTA 954 0 

AACATTTAGA CGCTTGTATC ACACGTCTAC GTGTTGAAGT TAACGACAAA TCTAAAGTTG 9600 

ATGTTC CTGG TTTGAAAGAT TTAGGCGCAT CTGGTGTATT AGAAGTCGGC AATAATATGC 9660 

2S AAGCAATTTT TGGTC CT AAA TCTGACCAAA TCAAACATGA AATGCAACAG ATTATGAATG 972 0 

GTCAAGTAGT AGAAAATCCT ACTACTATGG AAGACGATAA AGACGAAACT GTTGTTGTTG 978 0 

CAGAAGATAA ATCTGCAACA AGCGAATTGA GCCATATCGT GCATGCACCA TTAACTGGTG 984 0 

AAGTAACACC ATTATCAGAA GTGCCTGATC AAGTGTTCAG CGAAAAAATG ATGGGTGACG 9900 

GTATCGCTAT CAAACCTTCA CAAGGTGAAG TTCGTGCACC ATTCAACGGT AAAGTACAAA 9960 

35 TGATTTTCCC AACAAAACAT GCAATTGGTC TTGTATCAGA TAGTGGTTTA GAACTATTAA 10 020 

TCCACATCGG TTTAGACACT GTTAAATTAA ACGGAGAAGG CTTTACTTTA CATGTTGAGG 10080 

AAGGTCAAGA AGTTAAACAA GGTGATTTAT TAATCAACTT TGATTTAGAC TACATCCGCA 1014 0 

40 ATCATGCAAA GAGTGATATT ACGCCTATTA TCGTGACACA AGGAAACATT ACAAACCTTG 10200 

ATTTTAAACA AGGTGAACAT GGCAACATTT CATTTGGCGA TCAATTATTT GAAGCTAAAT 10260 

AATGCTTACT ATAAACAGGT GCGTATACCT TCATAAGGTG ACGCGCCTGT TTTTTCTTTG 10320 

45 CTATTGTATT TTGCAG CATC ATTGATAGTT CGCTCTCCCC TTAAATTTTG AATTTTAAGA 10380 

TCATCAATTA AAGCCCCCCT TCATACTCAT TTCCTAAAAA ATATTAATTG TTCACTATTG 10440 

TTAGCGTTTT CACAACAAAG TCAACTTCCT TGACCTTACA CTATATTCGA GGCTATCATT 10500 

50 

TTAAGTGTAA ATATAGAGAA AAGGTGGCTT TTTTTATGAA ACAACGCATT GGAGCTTACT 10560 

TAATTGACGC TATTCATCGA GCAGGCGTCG ATAAAATTTT TGGTGTTCCT GGTGATTTTA 10620 

SS 
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ATGAATTAAA CGCAAGTTAC GCAGCGGACG GTTATGCCCG TCTTAATGGA CTCGCTGCAT 1074 0 

TAGTTACTAC ATTTGGTGTT GGCGAATTAA GTGCCGTCAA CGGTATCGCA GGTTCATATG 108 00 

CTGAA CG CAT ACCTGTCATT GCGATTACAG GTGCGCCGAC ACGTGCTGTT GAACAAGGCG 10860 

GTAAATATGT ACATCACTCA CTTGGTGAAG GTACATTTGA CGACTATCGA AAAATGTTTG 10 920 

CACATATAAC CGTTGCACAA GGTTATATCA CACCTGAAAA TGCAACAACC GAAATACCAC 10 980 

GTTTAATTAA TACAGCAATC GCCGAAAGAC GCCCAGTTCA TTTACATTTA CCAATCGATG 11040 

TCGCAATCTC TGAAATTGAG ATACCGACAC CATTTGAAGT GACGGCAACT AAATATACGG 11100 

ATG CAT CAAC ATATATAGAG TTATTAGCAA CTAAACTGCA TCAAGCGAAG CAGCCTATCA 11160 

TCATTACTGG ACATGAAATT AACAGTTTTC ACCTCCATCA AGAATTAGAA GATTTTGTAA 11220 

ATCAAACACA GATACCAGTA GCACAACTTT CATTAGGAAA AGGTGCTTTT AATGAGGAAA 112 80 

ATCCATATTA TATGGGTATT TACGATGGGA AAATTGCCGA AGATAAAATA CGAGATTATG 11340 

TGGACAACAG CGATTTAATT TTAAATATTG GAGCCAAATT AACAGATTCA GCAACAGCAG 114 00 

GTTTTTCATA CCAATTCAAT ATCGATGATG TCGTTATGTT AAATCATCAC AATATCAAAA 114 6 0 

TTGACGATGT TACAAATGAT GAAATATCTC TACCATCATT GTTAAAACAG TTATCCAATA 1152 0 

TTTCATATAC GAATAACGCA ACGTTCCCTG CGTATCATCG TCCAACATCA CCCGATTATA 11580 

CTGTTGGCAC AGAACCATTA ACACAACAAA CTTATTTTAA AATGATGCAA AATTTCTTAA 11640 

AACCAAATGA TGTCATCATT GCTGATCAAG GTACATCATT CTTTGGTGCT TATGATTTAG 1170 0 

CATTATACAA AAACAATACT TTTATAGGGC AACCGTTATG GGGTTCTATC GGCTATACAT 117 6 0 

TACCTGCAAC ATTAGGTTCA CAATTAGCAG ACAAAGATCG TCGTAACTTA TTATTAATTG 11820 

GTGATGGCTC ATTGCAACTA ACTGTTCAAG CTATTTCAAC TATGATTAGA CAGCATATTA 118 80 

AACCSGTATT ATTTGTGATT AATAATGACG GCTATACGGT AGAACGACTT ATTCACGGCA 11940 

TGTATGAACC TTATAATGAA ATTCACATGT GGGATTATAA AGCTTTACCA GCTGTATTTG 12 0 00 

GTGGTAAAAA TGTTGAAATT CATGACG TTG AATCATCAAA AGATTTACAA GACACGTTTA 12060 

ATGCAATTAA TGGTCATCCC GATGTGATGC ATTTTGTCGA AGTCAAAATG GCTGTCGAAG 12120 

aCGCACCGAA GAAACTCATC GATAt CGCTA AAGCTTTTTC ACAACAAAAT AAATAATTTC 1218 0 

ATCGTATACA GGGTATAAGT TTAAGCGAAT ACTTTATTAA ACGAATAGGA CTCTGATATA 1224 0 

AGATGATTAA TTTTAATAAA ACCGCTTTAG TGTTAATCGA CCTGCAAGAA GGTATTCTTA 12300 

AAATGGATTA TGCCCCATAT ACAGCTGAAA ATGTCGTTCA AAACGCTAAT AAATTAATAG 12360 

ATGTTTTTAG AAAAAACAAT GGCTTTATCG CTTTTGTTCG CGTGAATTTC TATGATGGTA 12420 
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AGTCGTTTCC ATCATTTATT AGACAAGAGA GATGACGATT TTGT CAT AG A CAAACGACAT 12 540 

TTTAGTGCAT TTGTAGGAAC AGATTTGGAC TTACAATTGC GACGTCGAGG AATTGATACG 12 6 00 

5 ATTGTTCTTG GTGGTGTCGC AACGCATATT GGCGTAGATA CGACAGCGCG AGATGCCTAT 12 6 60 

CAATTAAACT ACAATCAGTT TTTTGTTACA GATATGATGA GTGCACAAAA CGAAACGCTA 12 72 0 

CATCAATTTC CAATAGATAA TGTATTCCCA TTGATGGGAC AAACAATAAC TACAAACGAC 127 80 

io TTTCTAAATA TATTGAACTA AACATATACT TCCCCCCTTC GATCATGTTG AGGGGGATCT 12 840 

TTATTTCACA AAGTATTAAT ACGTCGGGTT GTCTAACCTT CTATATTTAA CATATTCTAT 12 900 

AT CTGTTAAA TCG TTCTTAA CTTACGCCCC TACTACATAA AAAACAGTAT TTATTCCGGA 129 6 0 

IS 

ATTTTCAAAA AATTTAGTAT TTATTGCAAA ATTATGTATC ACTTTATGTT TAATTTTTGA 13020 

TATTATCTTA ATTAAGTAGA TTTTTATAAG TTCTAAAAAG GAGAACAAAT ACATATATGA 13080 

2o AGAAGAAACT AACATTTAAA GAAAACATGT TTATAGGTTC TATGTTATTT GGTTTATTCT 1314 0 

TTGGTGCCGG CAATCTTATC TTCCCAATAC ACTTGGGTCA AGCTGCTGGT TCTAACGTTT 13200 

TTATCGCTAA CTTAGGATTT TTAATTACAG CAATTGGCTT ACCATTTCTA GGTATCATTG 13260 

25 CTATTGGCAT TTCAAAGACA TCTGGTTTAT TTGAAATTGC ATCGCGTGTT AATAAAACAT 13 320 

ATGCTTACAT TTTCACGATT GCCTTATATC TAGTTATCGG ACCATTTTTC GCCTTACCTA 13 380 

GACTGGCAAC GACATCATTT GAAATTGCAT TTTCGCCATT TTTATCACCA AAGCAAATCA 13440 

30 CTTTATATTT ATTTATTTTT AGCTTCGTCT TCTTTGTGAT TGCATGGTTT TTTGCGAGAA 13 500 

AGCCATCAAG AATTTTAGAA TATATCGGTA AATTTTTAAA TCCGGTATTC TTAGTATTAT 13560 

TAGCAATTAT TTTATTATTT GCTTTTATCC ATCCATTAGG TGGCATATCT GATGCACCTA 13620 

35 

TTAGTAAACA ATATCAATCA CATGCCTTAT TTAACGGCTT TTTAGATGGA TACAATACCT 13 68 0 

TAGATGCGCT AGCGTCATTG GCATTTGGTA TTATCATTGT TGCAACGATT AAAAAGTTAG 13 740 

GTATCGAAAA TCCAACTGAT AT CGCTAAAG AAACAATTAA GTCTGGTACT ATCAGTATCA 13 800 

40 

TTATGATGGG GATCATTTAT ACCCTACTAG CAATCATGGG TACATTAAGT ATTGGTCATT 13860 

TCAAACTTAG TGAAAATGGT GGTATTGCCT TAGCGCAAAT TACTCAATAC TACTTAGGTA 13 920 

45 ACTACGGTAT CGTCCTGTTG TCACTTATCG TTATGGTTGC TTGTTTAAAA ACAGCCATCG 13 980 

GTTTGATTAC GGCATTTTCA GAAACATTCG AACAC CTTTT CCCTAAAATG AATTACCTAG 14 04 0 

CGATTGCAAC AGTTGTAAGC TTTATTTCGT TCTTATTCGC GAATGTTGGT TTAACTAAGA 14100 

50 TTATTATGTA CTCAGTCCCA GTGTTAATGT TCTTATATCC ATTAGCAATT GCCTTGATTG 14160 

TACTAACATT ATTTAGTAGC AAATTCCATC ATTCAAAACT TATTTATCAA TGTACCATTT 14220 
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GCACATCATT CTCACAAACT TTGATTAATT TCAGCCAAAA ATATTTACCA TTATCAGACA 14 34 0 

TTGGTATGGG CTGGGTTGTT CTCAGTTTGA TTGGTTTCAT TATCGGCTTC ATTATTTATA 14 4 00 

5 AAATTAAGCA TCGTAAAATT C CACAAG CAT AATACTATGC CACAGTCATA TGTTAAACAT 14 4 60 

ATGCTTGTGG CATTTTTTAT TCATACTACA TTAAACTGCA ATCGTATACA TACATATCAA 14 5 20 

TGATTATCCA CAAAAAATAT TAGTACTTTC ATTTTACAAA TCACATTAAT ACAAACACAA 14 580 

10 

CCTTATCTTT ATATTATTAA ATTTATATTT GACACTTATA TTGAACAACT GTAATATATT 14S40 

AATATTAATT CTTTAAAATG TATAAATATA AAGGAGGGAG ACCGATGaAT TCAATCATTG 14 7 00 

aATTAACTGA TTATTATAGC TCTAATAATT ATGCACCACT TAAGCTTGTC ATTTCTAAAG 14 760 

15 

GTAAAGGTGT CAAAGTTTGG GATACTGATG GCAAACAATA TATAGATTGC ATTTCGGGTT 14820 

TTTCAGTTGC AAACCAAGGC CATTGTCATC CAACAATTGT TAAAGCGATG ACAGAACAAG 14880 

20 CTTCAAAGTT GTCTATCATT TCACGTGTCC TTTATAGTGA CAATCTCGGG AAATGGGAAG 14 94 0 

AAAAAATTTG TCATCTTGCT AAGAAAGACA AAGTACTCCC CCTTAACTCT GGTACTGAAG 15 0 00 

CTGTTGAAGC AGCCATTAAA ATTGCTAGAA AATGGGGCTC TGAAGTTAAA GGCATTACTG 15060 

25 ACGGACAAGT TGAAATCATC GCTATGAATA ACAATTTTCA CGGTCGTACA CTTGGCTCAT 15120 

TATCACTATC TAACCACGAC GCATATAAAG CAGGATTTCA CCCCCTACTT CAAGGCACTA 15180 

CAACAGTAGA TTTTGGAGAC ATTGAACAAT T AA CACAAG C TATTTCACCG AATACAGCAG 15240 

30 CAATTATTTT GGAACCAATT CAAGGTGAAG GTGGCGTTAA TATACCACCG AAAGGATATA 15300 

TTCAAGCTGT GCGTCAACTA TGTGATAAAC ATCAAATATT ATTGATTGCA GAT GAAATTC 153 6 0 

AAGTTGGTCT TGGTAGAACT GGGAAATGGT TTGCTATGGa ATGGGAGCAA GTCGTTCCAG 15420 

35 

ACATTTATAT TTTAGGTAAG GCATTGGGTG GCGGCTTATA CCCTGTATCT GCTGTACTTG 15480 

CAAATAATGA TGTCATGCGT GTTCTAACAC CAGGTACACA TGGTTCAACA TTTGGTGGTA 15540 

4Q ACCCTTTAGC CATTG CAATA TCGACGGCAG CGCTTGATGT ACTTAAAGAT GAACAACTGG 156 00 

TTGAACGATC AGAACGCTTA GGTTCATTTT TATTAAAAGC GTTGCTACAA CTT AAA CATC 1566 0 

CTAGTATTAA AGAAATTAGA GGTCGTGGTT TATTTATAGG CATAGAGCTT AACACAGATG 15720 

45 CTGCACCTTT TGTGGATCAA CTGATTCAAC GTGGAATCTT ATGCAAAGAC ACGCATCGTA 15780 

CTATCATTCG ATTGTCTCCA CCTCTAGTCA TTGATAAAGA GGAAATCCAT CAAATTGTTG 15840 

CAGCTTTTCA AGACGTTTTT AAAAATTAAC AATT AAT CAT TTATATATGA CAT AGGAG GG 15900 

50 ATTCATGATG ATTAAAGTAG GTATCGTTGG CGGTAgcGGT TATGGCGCAA TTGAATTAAT 15960 

TCGATTGTTA CAAACACATC CTCATGTAAC GATTGCACAC ATCTACTCAC ATTCAAAAGT 16020 
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ACTTACAGTG 


GaTAATAATG 


ACTGTGATGT 


AATTTTCTTT 


GCGACACCAG 


CACCCGTAAG 


16140 


TAAAACATGT 


ATCCCTCCCT 


TAGTAGAAAA 


AGGTATTCAT 


GTTATCGATT 


TATCTGGCGC 


16200 


ATTTAGAATT 


AAGAATCGTG 


AAATATATGA 


AG CATATTAC 


AAAGAAACTG 


CTGCAGCACA 


16260 


AGATGATTTG 


AATCATGCTA 


TTTACAGCAT 


TTCAGAATGG 


CAATCGTTTG 


ATAACAATGG 


16320 


AACGAAG CTC 


ATTTCTAATC 


CTGGCTGTTT 


CCCTACAGCA 


ACATTATTAG 


CATTACATCC 


16380 


ACTTATTAGC 


GAAAAAATAG 


TAG ATTT GTC 


ATCTATTATT 


ATTGATGCTA 


AGACCGGCGT 


16440 


GTCAGGTGCT 


GGTCGTTCAT 


TATCACAACG 


gTTcATTTTT 


CAGAAATGAA 


TGAAAATCTA 


16500 


AGCGCTTATG 


CAATCGGAAA 


CCATAAA CAC 


AAACCGGAAA 


TCGAGCAATA 


TTTATCTATC 


16560 


ATTGCGGGTC 


AAGATGTATC 


AGT CAT ATTT 


ACACCACATC 


TCGTACCAAT 


GACACGAGGT 


16620 


ATTTTATCAA 


CAATATATGT 


CAAATTATCA 


T CTGAAT ATA 


CGACTGAATC 


ATTACATAAA 


16680 


TTAATGACCT 


CTTATTATGC 


TAATCAGCCA 


TTTGTCAGAA 


TTAGAGATAT 


TGGGACTTTT 


16740 


CCAACCACAA 


AAGAAGTACT 


CGGTAGTAAC 


TACTGCGATA 


TCGGCATCTA 


TGTAGATGAA 


16800 


ACAACGCAAA 


CAGCAATTTT 


AGTATCAGTG 


ATTGATAACC 


TTGTCAAAGG 


CGCAAGTGGG 


16860 


CAAGCCATTC 


AAAATTTAAA 


TATATTATAT 


GATTTTGAAG 


TGACGACTGG 


CCTAAATCAA 


16920 


TCACCAGTTT 


ATCCATAAGG 


GGTGTTAGAA 


TGAAACATCA 


AGAAACGACA 


TCACAACAAT 


16980 


ATAACTTTTC 


AATTATTAAA 


CATGGCGATA 


TCAGTACACC 


TCAAGGCTTC 


ACGGCTGGTG 


17040 


GTATGCACAT 


CGGTTTACGC 


GCTAACAAAA 


AAGACTTTGG 


GTGGATTTAC 


TCATCGTCTT 


17100 


TGGCAAGTGC 


AGCTGCCGTA 


TATACTTTAA 


ATCAGTTTAA 


AGCTGCACCA 


CTTATTGTCA 


17160 


CTGAAGACAC 


TTTACAAAAG 


TCTAAAGGAA 


AATTACAAGC 


ACTTGTTGTT 


AATTCAGCTA 


17220 


ATGCAAATTC 


TTGTACCGGT 


CAACAAGGCA 


TAGATGATGC 


ACGACAAACA 


CAAACATGGG 


17280 


TTGCTCAACA 


ACTTCAAATA 


CCATCTGAGC 


ATGTTGCTGT 


TGCTTCAACT 


GGGGTCATTG 


17340 


GTGAATATTT 


GCCTATGGAT AAAATTAAGA CTGGGACCGA 


ACATATTAAG 


GATGCTAATT 


17400 


TTGCAACGCC 


AGGTGCGTTT 


AACGAGGCAA 


TTTTAACAAC 


TGATACCTGT 


ACAAAACATA 


17460 


TCGCTGTATC 


ACTAAAAATC 


GATGGTAAAA 


CCGTTACAAT 


TGGTGGTAGC 


ACCAAAGGTT 


17520 


CAGGTATGAT 


TCACCCAAAT ATGG CTACCA 


TGCTTGCTTT 


TATAACAACC 


GATGCATCGA 


17580 


TTGAATCGAA 


TACACTTCAT 


CAATTATTAA 


AATCTTCGAC 


TGACCATACA 


TTTAATATGA 


17640 


TTACTGTTGA 


TGGCGATACA 


AGTACAAATG 


ACATGGTATT 


AGTCATGGCA 


AATCACCAAG 


17700 


TTGAACACCA 


AATACTTAGT 


CAAGACCATC 


CACAATGGGA 


AACATTTGTT 


GATGCATTCA 


17760 


ATTTTGTCTG 


TACATTTTTA GCTAAAGCTA TAGCCAGAGA 


TGGCGAAGGC 


GCAACAAAGT 


17820 
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CTATCGTAAG TTCAAATCTA GTAAAATCAG 
GAATCATTAC AGCTATTGGC TACAGCGGAT 
5 AACTGAACCA AATACCTGTC GTTGATAAAG 

TGTCGAATAC ATTAACTCAT GAAAATGTCA 
CTGCAGCGAC TGCATACGGT TGTGATTTAT 

w 

ATCGAACATA AGGTGGTGTT GGTTAGATGA 
CACTTAGTGA CATGCATCCA TCAATTATTA 
TCTACCCCAT TATCGTTCAT GGCGGTGGCC 

)£ 

AAATCGAGCC ACACTTTGTT AATGGCCTAA 
CTAAACACAC GCTCATTGCA GACGTTAACA 

20 AATGTTCTGC AATAGGCTTA TGTGGTTTGG 

ATCAACAATA TGGATATGTC GGTGTTCCGA 
TATGTACTAA ATTTGTACCT AT CATCAATT 

25 TTTACAATAT TAATGCTGAC ACGCTTGCCT 

TTTATGTATT AAGTAATATT GCAGGTGTAC 
CATTAGTCGA TATTCATCAA TATATTGAAC 

30 AAGTGCTAGA TGCCAAAAAT GCGATTGAAA 

GAAACAAGCC AAATATCATT GAATCTATTT 
TTAATTCATA ACTATGAAAT TAAGGCCTAA 

35 

CGATTATCCA TTGCGCTAAA ACATTTATTT 
AGTSCGATAC AATATGAGAT GTAAAAAACT 
TATTTTAAGT TTTGCAAAGC TTTTTATTGT 

40 

TAGTAAATAG AGAGGAGTCC TTAAGTTGAC 
TGGAATTATC GGTGGCTTGT TATCTGGAAT 

4S ACCTCGCACA CCAGAACGTA ATGCAACGAA 

ATTTAGTAGT GAGTTTACGC ATCAAACATA 
AAGCTTTATT GTCCACTTTA GTTTTTCTAT 

50 TAAAAAATAC GCTTACTTAG CAATGGGACA 

ATTATTCCAC CTTATCATTA TGCCAATCAT 

55 



CTATTTTTGG CGAAGATGCC AATTTTGGTC 17 940 

GTGAAATTGA TCCTAACTGC ACATATGTTC 18 000 

GTATGG CTGT ACTATTTGAT GAGCAAGCTA 18 060 

CAATTGACGT TCAGCTTGGT TTAGGTAACG 18120 

CCTATGATTA TGTGCGTATC AACGCATCAT 18180 

AATTTATTGT CATTAAAATT GGTGGCAGTA 18240 

ACAACATTAA GCATTTACGA TCAAACAACA 183 00 

CATTTATTAA TGAAGCATTA TCAAACCAGC 183 60 

GAGTGACTGA TAAAGCAACC ATGAC CATTA 184 20 

CTGCATTAGT AGCTCAATTT AACCAGCACC 18480 

ATGCACAGCT GTTTGAAATT ACATCTTTTG 1854 0 

CCGCTTTAAA TAAGGATGCT TTACAGTATT 18 6 00 

CGATTGGTTT CAATAACCAT GATGGAGAAT 18 6 60 

ATTTTATTGC ATCATCATTA AAAGCGCCTA 18 720 

TCATCAATGA TGTTGTTATA CCTCAATTGC 18 78 0 

ATGGTGATAT TTATGGAGGT ATGATTCCCA 18 840 

ATGGCTGTCC TAAAGTTATC ATTGCATCAG 18 900 

ACAATAATGA TTTTGTTGGC ACAACAATCC 18 950 

CAAGTTTTGA CACGCGAGAT GATTCCAGTT 19020 

ACCGTTCATC TCGTTAACAA TTTTGAATAC 190 80 

AATAACCTTT TACAAATTTG TTTATCAAAA 19140 

GATTATTTTC ACAAAATACT ATAATGAGGA 19200 

GAAACGACAA ATGGGTATAT TCATTTATGC 19260 

TGTAAAATTA GGTTGGGAGG TCATGTTTCC 193 20 

CCCACCTCAA GAGTTATTGC AACAATTAGG 193 8 0 

TACATTTTCA AATATGGAAT TGCCTTGGGT 19440 

CGTCATTGCA ATTATTTACT GCATATTAGT 19500 

AGGTGCTGTT TTTGGTATTG CTATTTGGGT 195 60 

GCATACTGTA CCTGCTGTGT GGGATCAACC 1962 0 
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AGTGCGACAA 
TGAGTTTtAA 
ATGATATGAT 
ATTATTTTCG 
TCGTCATGAT 
ATCTAACAGT 
CGT CAT ATTA 
GTCCTAAGAA 
CACGTGATTG 
CTTCACCAAT 
AACTACATAT 
AACGTTGTGA 
TATAAGGATA 
CAATATCTGC 
TGTCATGTTG 
GATTGTATCT 
ATTCTTCAAT 
CTACTTACTT 
TTATCGTTGG 
TCATTGCTAG 
GTTTCTGTAA 
CGCATTCTAA 
GTGGTGTGTT 
AATCTACAGG 
TTACCATTGA 
TCGTCAAATT 
CTTTTAATTC 
AGACATCCGC 
TTATCGTAGA 



CATTTTGTCT 
ATCATCGTTT 
TCCAGCCAAC 
GTAATTTCAA 
TTTGAATGAT 
AAACATTTAG 
ACTACTCAAT 
ACAT AC CTGT 
ATAAAAGTGT 
CAATTTTGTA 
TTGATGTGCT 
TATCTTTTCG 
ACTATATGAT 
CTTACCTCGT 
AATTCCATAT 
ATAGTTGACT 
ACTTTTCAAG 
ATTGAATATT 
CCATTTTTCA 
TTGTTGTTCA 
AATTTCATTA 
CAAAGATTTC 
GACCTGTGCT 
CATTTCAGCC 
AAAACGGTTA 
ACCAACACGT 
ACTATAAAAT 
TTsTGAAAAT 
CACATATATT 



ATCGCTATAA 
GAGTATGATG 
TTACGTGAGC 
TATTGCTCAG 
GCCATCGTGT 
GCAGTATAGT 
AACTGAAATA 
ACCATAAACT 
GATTGTGTCA 
AAACTTTCTT 
TCGTTTGTAG 
ATATCAATAC 
AAGCTCACAT 
GGC GAAATGT 
TGCACTAAAA 
GTACGCGGTT 
TTACTCTGTA 
GTTTTGATAT 
CTGATGTGAT 
CGGTCAACAC 
AATGATTCAT 
ACCGGCATTT 
AATGCGACAA 
ATGCTAACCC 
GT CTTTATAT 
ACAATCCGAC 
TTGCTCCGTG 
GTCACATCTT 
AACCTTGCAT 



ATTAAATTAA 
ATTGATGCTC 
ATTAAAGTCT 
TATATTTTTA 
ATTCACCTTT 
TTAAAATCAC 
CAGACACTTT 
GATCAAAAAT 
TATCATAAAT 
TTTGTGTCCA 
AGAAACACGT 
CAACTGGTTC 
AGATGGG CTG 
GATAATG CCA 
TATCTCCCAA 
TTTTATATGA 
ATTG CAT TAC 
ATTGTGC CCA 
TCATTATTTT 
TAGTTAATCC 
CGCTGACGAG 
TATTAGGTGA 
TTTGTCTTGC 
CGATACAATC 
TTCTCATATG 
CATCTAAGCC 
TATATGGTGA 
CTGTGTCTAT 
GATGTTGTTG 



TACACTGACT 
ACGTTATTTT 
CAAATGCGTC 
CCTTATCACT 
CATTTTTCCA 
TGCGCAATGA 
TTTATAACCC 
AAATTGTTTG 
GTCCAATCCT 
TATTTGATAA 
CACTAACGTA 
TTTATCGACA 
TCCATCACGA 
TTCATGTGGT 
TCTGTGCATG 
CCAACGACTT 
AAATACTG TC 
ATGATACAGC 
TAATGTTAAT 
AATCGTTTCG 
TTCAATTTCT 
TAGCACATGG 
AGTCGTATCC 
CAGTTGTAAC 
CCATCTTCCA 
ATTATTTACA 
TGTTAGTAGT 
ATCAAAATAA 
TGCCAAACGT 



AACATTAACG 
ATTAACTGAC 
GTAACAAACT 
TACTTTAATC 
ATAAAAAAAC 
TACTGTCAGA 
CAGGGTGCCT 
AACTTCACTT 
TTGATTAAAC 
AAATCATTTA 
CGCCAGTCTA 
ACACACACGA 
TTGTGTTGAA 
AATAAACCTG 
AGTTTATCTT 
TGTGATATTA 
ATAACTTTCC 
CAATTGTTAG 
GTTGTATCTA 
TACATGTCTT 
TTGCGCTTAA 
TAAATGATTT 
ACAAAAGAAA 
AAATCATTCA 
TTGTAAGGAT 
GCTTCTAATA 
TGCCCTTTAT 
GTTCCCACAC 
ATGACATCAA 



19740 
19800 
19860 
19920 
19980 
20040 
20100 
20160 
20220 
20280 
20340 
20400 
20460 
20520 
20580 
20640 
20700 
20760 
20820 
20880 
20940 
21000 
21060 
21120 
21180 
21240 
21300 
21360 
21420 



943 



EP 0 786 519 A2 





CACCTGCATG AATAATCGTA 


TCCATGTTTT 


CTGGTAAAAC AACATCATCC 


ATACACTCGA 


21540 




AATCACCAAC AATGACTTCA 


ATGTTTGATA 


ACATTATTTC AACCGTCTCT 


TCTGAAAAAT 


21600 


5 


AATCATTTAA ATTCGTCATC 


AACTTAT AC C 


ATGCTATTTC CTCATTATCA 


GCACGTATGA 


21660 




AACAATAAAT GCGATGACTG 


TATC CTTGTA 


GTACTTCAAT CAGATAAGCA 


CCTAAAAAAC 


21720 




CTGTCGCGCC AGTCAATAGT 


GTATTTCCTA 


GAG GTCGATG ACTTAGACTA 


TCCTCTAAAA 


21780 




TACCCAAGTT ATAACGAGAC 


ATAACAATCT 


TTTGTAATTC CGAAAGATTA 


TCCGGTAATG 


21840 




CAACTAATGA TTGTTGATTT 


TGGTA CAT AT 


AATTAACAAT CTGTCGCACG 


GTTTTATATT 


21900 


J5 


GGTATAATGT CTGCATTGAA 


ATATGATGG C 


CAAATCGTTT TAAATGCGAG 


ACAACTAACA 


21960 




TCGCCTCTAA TGAGTTACCA 


CCAAGTTCAA 


AGAAATCATC GTCAACACCG 


ACATCATTTT 


22020 




GTTTCAATAC CTCTCCAAAT 


ACATCAACAA 


ATGTCTGCTC AATTTCATTA 


GAGGGTTCGC 


22080 


20 


TATACACTTT ATTAGACTGT 


TGTATAGGTG 


ATGGATTTGG CAAACGCGTA 


GTATCCACCT 


22140 




TGTCATTCGT GGTTAATGGC 


ATACAATCGA 


TATGCGTTAT AGTCTTAGGA 


ATCATATACT 


22200 




TAGGCAGCTG ATCATT TAAA 


TATTGCTTCA 


AATCCTGTTC CACTTGTTGC 


TCTC CGACAT 


22260 


25 


AATAAG CATT CAATATATCA 


TGCGTATCAA 


AGTGACTTAC TGTTACAACA 


CAATCAGATA 


22320 




TACCACGAAT AGCTAATATT 


GCATTTTCAA 


TTTCATCAAG TTCAATACGG 


TAC C CGTTAA 


22380 




CTTTCACTTG TTTATCTATT 


CTTCCTAAAA 


ATTCAATTTG ACCATCAGAT 


GTATAACGTG 


22440 


30 


CTAAATCACC ACTATGATAC 


AACTTTCCTT 


TAC CAAATGG ATTATTTTGC 


CATTTATCAG 


22500 




CCATTAATTC TGGACGATTA 


ATATATCCTA 


TCGCTAAACT ATCACCTGCA 


ATACACAACT 


22560 




CGCCTGGCAT ACCAATACCG 


CATAACAAAC 


CATCTGACAT AATATACACT 


TGGATGTTAG 


22620 




ATAAGGGTTT GCCAATTGGA 


ATCGTCTCAG 


GTATCAAATC ACCACAATGA 


TGTGACCAAT 


22680 




ACGATGTGAT GACTGTTGAC 


TCAGATGGTC 


CATAGGCATT GAAATACGTG 


CCACAATGCT 


22740 


40 


TCTCAATATA TTTAACAAAG 


GATGCCGTAC 


TAGTTGCCCC GCCTGTAATC 


AACTTTTCAA 


22800 




TATAAAAGTC TTCCATAACA 


CTACACATCT 


GTAACGGAAT CGACGCAACC 


GTCACACGAT 


22860 




GCTTATTAAT GAGTTGTTGT 


AACTGTTCTG 


GATTAACACG TTCCTCTCTA 


TCTGGAATCA 


22920 


45 


CAAGCGTATG ACCATTTAAC 


AAACAACAAT 


AAATCTCCAT AACTGATGCA 


TCAAAAACAA 


22980 




TATTTGCATG TTGCAAAAAT ACTTCATTGT 


CGCCTAATTG CAATTCAGTT 


GACCATGCAT 


23040 




GCACTAAATT CAACAAATTT 


CGTTGTCGTA 


TGGCAACCCC TTTAGGCATC 


CCGGTCGTAC 


23100 


50 


CAGATGTGTA AATAGCATAC 


ATCTCATTAT 


CTAACATCGC TGTGTTTTCA 


AGTTGATTGC 


23160 




CATGTAAATC ATCATATTGT 


TCATTTTCCT 


TTGATT CAAC AAAGCCTTTA 


GCATTTTCCA 


23220 



ss 
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TAGCATCCTC CAAAATTGCA CCTTGTCGTT TATTCGGAAA ATCAATATCG ATAGGTATAT 2 3 340 

AAGATGCACC TACTTTAACT GTCGCCAACA TCGCCGCAAT CATTTCAAAA CTACGTTCTG 2 3400 

TAAACAAGGC AACCCGTTGA CCATTGCCCA CACCATTTGA TAGGAGCATG TGCGCAATGG 2 34 60 

CATCCACATA GTTGCGTAAT GTTTCATACG TCATTGTCAA ATCATTCATG ACTAGCGCAA 2 3 520 

CATGATTACC TTGTCGTGAG ACAACTTCAT TAAAGTAACT TATGATAGAT TTATTTCCCG 2 3 580 

GGACATTAAG CATTCGATCG TTAACATGCG TATTGACCCA ATTTAGAAGT TCCTCCGTGC 2 3640 

CGTTTGGTAT ATCACAAATT TGTAGTGTAT CTTGATGCTT CAAAATATAA TCAATCATAA 2 3 700 

TCATACATTG ATT AC CCATG TGACGAACTG TTT CTGAGTG ATATAAATCG GTATTATACT 23 760 

CGATATTGAT TGTATAGTCA TCGCGATCTT CTTCAATGAT GAAAGATAAA TCAAATTTCG 23 820 

CCGTCACTGA TTTGGGTTGA ATGTGTGTTA ATTTACTATG C C CAAAATG A GCATGATTCG 23 880 

TTTCATTGTT TTGTAGTACT AACATGACAT CAAATAATGG ATTCCGTGAG GCATCATGTG 23 940 

ATTGATCTAA GTCATTTACT AAACATTCGA ATGGGTATTC TTGATGCTCG TATGCCTCCA 240 00 

AACTCATTTC CTTAACCTCT TGTAAAAACT GTGTCCACAT TTTATCAGGT GACGGTTGCC 24 060 

CTCTATATAC CAACGTATTA GCAAACATGC CTAGCATTTG CTCCGTGCCT TTATGCATAC 2412 0 

GCGCACTCAT CACACTACCG ACAACAACAT CATCTTTTCG AGCATATCTA CTTAACAACG 24180 

TCATGACCAC ACTCATAAAG AACATAAAAT CAGTAATTTG ATGCTTTTCT ACATACTTTT 24240 

GAAGTAGCTG TCTCATTTGT TGATTCATTG TAAATGACAT CATTGCTCCA TTTGTCGTTT 243 00 

TAATATTTGG TCTAACATAG TCTGTCGGTA AGCTTAAAAT AGGTACTTCA TCTTTGAATT 24360 

GAGATAACCA ATATTGTCTA TGTTTCGTCA TATCACGATG CGACATCCAC TCACTATAGT 24420 

CTTTATATTG CAATTTAAGT GGTAACAATA ATTTATGTTG ATAAAGTGCG TTAAGATCAT 244 8 0 

TCATTAATTG TATATTACTC ATAC CGTCAT TAATGATATG ATGC GTATCT ATAAAGAGGT 2454 0 

ATGCATGTAA GGGACTTCTA ATGTATCTCA CTCTAATTTG ACTTGGCTTT TCCAAATTAA 24600 

AAGGTGCTAC AAATTGGCGC ATGATTTCTT GTTCATCCGT AAAATGCGTG TTAACTTCTT 24 660 

CAAAGTCAAC TGCAACATCT GCCACAATAC GTTGTCGAAC CTCATCATCT ACAACAATAT 2472 0 

ATTGTGTTCG TAAAATCTCA TGTCGCGCTA TCAAACGCTG CACTGCTTGT CGCAATTGAG 24780 

CTACATTAAG TTCTGATGAT AACCGCCATA AAAAAGGTAC GTTATACACC GTATCTTTAT 24 84 0 

GGTTTGATTT CCATAATAAA TACATACGCT TTTGTGCAGA GCTCAGCACA TAATCATCTT 24 900 

TAACTATAGT TTCTGGAATC ACTTCATAGT TTTGTTCTTG AACCTTAGCA ATCGCTTGTG 2496 0 

CTAGTTCAAA TACAGTTGGC TTTTGTAATA AATCACCAAT TTGTAATCGT TTCCCAGTAG 25020 
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AATTATCATG AATAC CTACT TGATTCACAT GTAAAATATC TGCAAAAATT TGGCATAGCA 2 514 0 

AGTGTTCGGT ATCTGTACTC GGTGCTACAT AGGCATCCGT ATCGACATAG TCCATGATAG 2 52 00 

5 GCAATGCCTT CTTATCTAAT TTCCCATTAA TAGTAATAGG AATTTGCTCA ATATGCATGA 2 5260 

AATTAACTGG TATCATGTAC TCCGGTAAGG TCATACGTAA TTGTGATTTA ATCTTATTAT 2 5 320 

GTGATAATGT ATGCATCGCT TCATAATAAG CAACGATATA CTGATCTTGA TCATGATTTT 2 5 380 

10 

GAACAATAAC AACTGCTTTA TTAATACCTT GTATACGCTC GAGCGCATGC TCAACCTCTG 2 5440 

ACAACTCAAT CCTAAACCCT CGAATCTTAA CTTGTTTGTC CTTTCGATAT AAATAATCTA 2 5500 

TGTTGCCATC GGGTAACAAA CGAACGATAT CACCACTTCT ATACATCAGC TGaTTTATAT 2 5560 

15 

TTGAATCTTT GATAAATTTA TCTGCTGTCA ATTCTGGCTG ATTTAAATAA CCTGCAGCTA 2 5 620 

ACCCAAAGCC ACTTGT A CAT AATTCTCCAG GAATACCAAC GCCACACCGA CGCTCGCCTT 2 5680 

20 GCATGATATA AACATGAGTA CCCAGAATCG GTTTACCAAT AGGAATACGA TTTGGAACTT 2 5740 

TGTTAGGTAT ATTATACGTC GTTGTAAATG TTGTATTTTC AGTTGGTCCA TAACCATTAA 2 5 800 

TAATTTGAGG ATGCTTCGGT TTTTGATTAA GCAAATCCAC CCACTTAGCA TTCAATACTT 2 5 860 

25 CTCCACCAAT TAATAAATAC TTTAACGGTA CCAATACTTC TATTCGTTCA CTAGCAATCT 2 5 920 

GATTAAATAA TGAGGAGGTT AACCACATAG TATTAACGTC ATTTTCATTG ATTAATTGTT 2 5 980 

CTACCGCTAT TGGATTTAAT AATTGTTCTT TTTTAGCAAC AATCAGCTTT CCACCATTGA 2 6040 

30 GCAATGCACC ATATATTTCA AATGTTGCAG CATCAAAGGC TATAGTTCCT GATAACAAAA 2 6100 

TCGTCGTCTC TTCATTTAAT GGTACATAAT GATTTTGATG GACCAAGCGA ACAATACCTC 2 6160 

GGTGCGGAAT TAGTGTCCCT TTAGGGTTAC CAGTTGTCCC CGACGTGTAA ATAACATAAG 26 22 0 

35 

CATGATCTTC TAACGTGTTA CATTTAGAAA GATTATCAAT ATTTTTCCAC GCTATCTTAT 2 6280 

TCAAiTCAAT GTGATTAATA TTTTGTTTAC CATTTTCATA TAAAGCTTGG TACGTTATTA 2 6340 

CAACTTTAGG CGTTACATCT TTTAAAATGT ACTCCTGACG ATCACTTGGA TAGTTCGGAT 26400 

40 

CAATTGGCAC GTAAGCCCCA CCAGCTTTCA ACACACCTAT CATCGCTATT ATCATCTCAA 2 6460 

TACTTTTTTC AGCTATGACA GCGACACGAT CATTAGGTTC AACACCATAC TGGTTTCTCA 2 6520 

4S AACGGTGTGC TAAATCATTC GCGCGTGCAT TCAATGTTTG ATATGTTATA AACAc TCCGT 2 6 580 

CAAATTGCAC AGCGACATGA TTCGGCGTTG CTTCAACTTG TTGCTCAAAT AAGGTAACAA 2 6640 

CTGTTTGCGC ATCATCTATC TCAGGCAAAC TTAAATTGAT ATCGTCATAT AATTGAATAT 2 6700 

50 CACGTTCTGT CATCAAATTA AGTTCATCTA CAGTTGTTCG TTTATTTCCA TTTTCTTCAG 2 6760 

TAATTTGCAA ATAAATATTT CGAACTAAGT CACTCAGCGT CTCGATTGAG AGCAAATCAT 26 820 
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CTAAAGATGT ATGTGCATCA 


TGTATTTGAT 


GTACATCCTC 


AATAACATCA 


TTACAACAAG 


26940 




ACATCATATG ATGATAACAA 


TGAAAAATAG 


TCTCTAGTGA 


AAGCGAAGAC 


TTCGCGCACT 


27000 


5 


GTAATTGCGA CATATTTTGC 


AACACACATT 


TATTAAAATC 


TGTTGTAAAA 


CGTTGACATA 


27060 




CATCTTTTGC ATCGATTGTT 


AACGTTAACG 


GCACAATATT 


TCCGTGTAAA 


TCATTTGGTA 


27120 




AATGTGATGG TACATG TATA 


CCTAATGTGA 


CAT CATGTTG 


TTGACTCATT 


ATATGATTAG 


27180 




CTAAATACAC ACTAACAGCC 


AACGATGCCA 


TAT CTATTGA 


TGTCATATCA 


TCAATCAAAT 


27240 




ACGTTTGATA TAAAGCTTGT 


TCAAATGGAT 


GCTTAATTGG 


AAAATAACTA 


TCAATATGGA 


27300 


IS 


TGTCAGAGTT ATTCTCTAAC 


CGAAAATAGT 


TTGAGTCTAA 


TGCTATATGC 


GATGCATCTT 


27360 




GATTGTCTTT ATCATCATTT 


CTATTTATAT 


GTGCATGCTG 


TCGAGTATTG 


TTAATAACAG 


27420 




TATTGCCACG ATATGCATTG 


CATAAATCAT CAAGAAnAAT ATCAATTTGA CTATCATCga 


27480 


20 


AAATGGaCAC ATGAAAATCT 


aATAGTATAT 


ATGcAGCATC 


AGCGAACTGm 


AACAATTTAA 


27540 




CTTTGAATAA AGGTGAATCA 


TTAAAATGGT 


AAGTACTTAA 


TTCTTGCTTA 


AAAAAAGCTT 


27S00 




CTAAATCATA GTTTGCGGAA 


GAAGATGGAA 


CTTGTTTTAT 


CTCAATAAAA 


GGCAGAAATT 


27660 


25 


CATGAAGTAT CATTGTTAAA 


TTGTCATCGG 


TAGTAACATC 


AAAAAAATGT 


CTTATAGATG 


27720 




CATGTTGTgC ACAATTGTCG 


ATAATG CATA 


CATCATTTTA 


GTAGCTTCAA 


CATTTTTAGC 


27780 




GAGTTTAACC CAATACGCAT 


TACGGTGTGT 


CGTTGATTCT 


GTATTATTTT 


TGTATATACG 


27840 


30 


AAAATATTCC TGTTGAAATC 


TCAAATTACC 


CATAATCATA AAAAGTCCTT 


CTTTCATATC 


27900 




ATAATACTCA TTACTTACTG 


AAATTGCATG 


ATGATATGAT 


AACCGACGAA ATGTTAATTA 


27960 


35 


ACTCGTTATG TAATGaTTAA 


TATaAAACAC 


CATTCGCAAC ATATGAGCGA 


TATATTCTAC 


28020 


CCTAAAATAC ATCTTGTATC 


ATCGTTACAA TTGGTATATT TTTCAATGTA AATTACATAC 


28080 




ATCTTCGATA AATAGCACAC 


TACAAATCGT 


TAATCACTTT 


CTGTTGTTCA 


CATCTCATTG 


28140 




CAAACTCAAT ATTGTTGTTA 


CAAAATATCC 


ATGAAGCAAG 


TTTATATTAA ACAAACAACT 


28200 




CGCATAAAAC AATTGTTATC 


CTTAAATTTT 


AACAAATTCT 


TAATAAATTT 


ATCTCTATTT 


28260 




TAATTAC GAC CAAATTAATA 


GGTTTTCCAT 


ATAAAAAGAT 


G CATAAAAT A 


AATATTTAAA 


28320 


45 


TAAATTCAAT TTGTATTCAC 


TTGTTTTTGT 


CCCCCAAATA 


CACCAGCAAC 


AAG CATGCTA 


28380 




GCACCAATTG TTAAAACGAT 


AAACATATAC 


AGTC CCATTT 


GTAATGACGT 


TAAGAAAACA 


28440 




CCCAACACAA TCCCTAACCT 


AGCTAGTGTT 


TCTGAAAAAT 


GAATACCTAA 


TGCATTAACT 


28500 


50 


GCACTATATG TTCCTCTTTT 


AGCTTTAGGA 


ATAATTTTAA 


AGCGTTGTTC 


TGAAACTATA 


28560 




GGCGAATAAA TAATTTCACC 


TACAGTCGCA 


ATTAT CAT AA 


AAACAACTAA 


TAAGCCAAAC 


28620 
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GCTTTTTTAA AATCTATTTT CAATACAACT TTCGAGATTG AATACGTGAG TAaAATGACG 2 8740 

ACGACCGTAT TAATCATTAG CAAGATTG CT AACATCTTAG CACCTGTAAT ATCATATGAA 2 88 00 

CCTATACTTA TTGTTTCAAA CTGAT CCTTT AGTCTAATAG CAATATATGA GGAGATTGAA 2 8860 

AATTCACCCA TCATGATGAT ACTGAACCCC GAAATCAATA ACATATAATT ACGGTCTTTC 28 920 

AAAACTAATT TATAACTGCG AAATATATTC ATTATTTGTA ATTTTTGATA ACGACTTGCA 2 8 980 

TGCCTCTTGT CATCACTTTG CTTTACTTGA TTTCGGTCTT GAGGTAACCA AATATATAAA 2 9040 

ATAAAGAGTA CAATTAAAAA TATACAAGCT GCTATTAAGA AAAGTAGTAA CATACTGTAG 2 9100 

CCATACATCA AGCCACCTAA CAATGCCCCA ATAGCTACCG ATAAGTTTGT CATCCAATAG 2 9160 

CTAATCTTGT AAATATAATG TTCCACGTCT TCGGTAATTG CATC CAT AAT TAATGTGTCC 2 9220 

ATAACTGGAA ATTGTAATCC CCAAACGATT GTAAATATGG CATATGCAAC ACAAAAACCA 2 9280 

ATAATTTGCC ACAATTGATG TGACCCAAAT ACGC CCATGA ACACAAGCAT TATCACCATC 2 934 0 

GTCGCTTGAT AAATAAGTAC TAGCAACTTT tTCGGAAATA TCTCAATAAG GTAACCAGAT 2 9400 

ATAATGGACA ATGGAAATTT nAGAACCACT AAACCAACAA GATATATACC GACAATTGAT 2 9460 

TGACTTAACA TATCTGTTAA ATATAGTGCT ATAAACGGTA TAAATGCTGT CGTAATAATT 29520 

AGCTGTAAAA nATTGCTAAT CAATCGTACT TTCAA 2 9555 
(2) INFORMATION FOR SEQ ID NO: 207: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1539 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



."" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 207: 

AAAAAAAAAA AAAAAnGGTG AATCTTTAAT TAAACACTAA TATTGTAAAA GATGTTAAGT 60 

AAACGCTTAA TGACACTTAT TTTTTGAAAA TAATAGTAAT ATCATTTTGT TAAATGAAAG 120 

AATAAAGCTA TAATmATTAT AGAATAACTA TTTAAAGGAG ATTATAAACA TGCCAATTAT 180 

TACAGATGTT TACGCTCGCG AAGTCTTAGA CTCTCGTGGT AAC CCAACTG TTGAAGTAGA 24 0 

AGTATTAACT GAAAGTGGCG CATTTGGTCG TGCATTAGTA CCATCAGGTG CTTCAACTGG 3 00 

TGAACACGAA GCTGTTGAAT TACGTGATGG AGACAAATCA CGTTATTTAG GTAAAGGTGT 3 60 

TACTAAAGCA GTTGAAAACG TTAATGAAAT CATCGCACCA GAAATTATTG AAGGTGAATT 420 

TTCAGTATTA GATCAAGTAT CTATTGATAA AATGATGATC GCATTAGACG GTACTCCAAA 4 80 
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AGCTGACTTA TTAGGTCAAC CACTTTACAA ATATTTAGGT GGATTTAATG GTAAG CAGTT 600 

ACCAGTACCA ATGATGAACA TCGTTAATGG TGGTTCTCAC TCAGATGCTC CAATTGCATT 660 

CCAAGAATTC ATGATTTTAC CTGTAGGTGC TACAACGTTC AAAGAATCAT TACGTTGGGG 720 

TACTGAAATT TTCCACAACT TAAAATCAAT TTTAAGCAAA CGTGGTTTAG AAACTGCAGT 780 

AGGTGACGAA GGTGGTTTCG CTCCTAAATT TGAAGGTACT GAAGATGCTG TTGAAACAAT 84 0 

TATCCAAGCA ATCGAAGCAG CTGGTTACAA ACCAGGTGAA GAAGTATTCT TAGGATTTGA 900 

CTGTGCATCA TCAGAATTCT ATGAAAATGG TGTATATGAC TACAGTAAGT TCGAAGGCGA 96 0 

ACACGGTGCA AAACGTACAG CTGCAGAACA AGTTGACTAC TTAGAACAAT TAGTAGACAA 1020 

ATATCCTATC ATTACAATTG AAGACGGTAT GGACGAAAAC GACTGGGATG GTTGGAAACA 1080 

ACTTACAGAA CGTATCGGTG ACCGTGTACA ATTAGTAGGT GACGATTTAT TCGTAACAAA 114 0 

CACTGAAATT TTAGCAAAAG GTATTGAAAA CGGAATTGGT AACTCAATCT TAATTAAAGT 1200 

TAACCAAATC GGTACATTAA CTGAAACATT TGATGCAATC GAAATGGCTC AAAAAGCTGG 12 60 

TTACACAGCA GTAGTTTCTC ACCGTTCAGg aAACAGAAGA TACAACAATT GCTGATATTG 1320 

CTGTTGCTAC AAACGCTGGT cAAATTAAAA CTGGTTCATT ATCACGTACT GACCgTATTG 13 80 

CTAAATACAA TCAATTATTA CGTATCGAgA TGAATTATTT GAAACTGCTA AATATGACGG 144 0 

TATCAAATCA TTCTATAACT TAGATAAATA ATTTTCTnTA TAATCAAATG CTGACATAAT 15 0 0 

TTTAGTTGAG GATTATTATG ACGGTATAAA TAAATAAAG 153 9 
(2) INFORMATION FOR SEQ ID NO: 208: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 84 6 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 208: 

CAATTTCTAT CTATCAATGA TGTGCATACT TCCAnTTAAA TTAAt CGAAA TGaATCAAGG 6 0 

TATATCATTC CTGCCTCTTT ATATAACaAC AAATAG TGAT TACAATATTT CGGTTATTAA 120 

CACGAAAATT TTACAAG CAC CTATTTCATT TACATATATA TACAGCAAAA AAGAAAGCCC 180 

AGAAATATTG GTGTTTATTA AATCATTTAA AAAGTATATT GCCAATGAAC AATTATAATA 24 0 

AATTTCAAAT CTAAAAAACC AAGAATGCGA TTAATCATCA CATTCTTGGT TCAATTTTAT 3 00 

TCATGAATTT TTTCAACATT AAACGTTAAG TTATTGTCTG AATTTAAATT AACTTTAATC 360 
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CGTTGTACAA AACGTTTTAA TGGTCTTGCA CCGTATTGAG GTTCATAAGC TTCTTGACCT 4 80 

AGC CAAGCTT TAGCATCATC AGAAACTTCA ATTGAGATTC GTTGTTCTAA TAAT CTTATA 54 0 

s TTTAATTGCG TTAAGATTTT ATCTACAATC ATACTCATGT CATCAATAGA TAATGGTTTA 6 00 

AATAATACGA TATCATCCAT ACGATTCAAA ATTTCTGGTT TGAAATATGC ATTTAAACTT 6 60 

GTCATAACAG CTTTTTCTG T TGATTCTGTA ATTTCACCAG TCTCTTTTAC GTTTTCTAAT 7 20 

'° AAAACTTGAG ATCCAATATT ACTTGTCATA ATAATAATAG TATTTTTAAA ATCAACGCTA 78 0 

CGTCCTTTAG AATCAGTTAA ACGGCtTCAT CTAAAATTTG CAATAATACA TTAAAGACGT 84 0 

CAGTAT 84 6 



15 

(2) INFORMATION FOR SEQ ID NO: 2 09: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1674 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

2S (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 209: 

nTGGGAACAG TAAGCCAGTA TTTTTAGAAA GTTGCCATAC ATGAGCGTCG ATTTTTCCAA 60 

TATGGCTATG ACACTAGAAC AATGGGAATT TGGAGGAAAA GTAAATGATT AAACCTAAAA 120 

30 TAGCATTAAC CATTGCAGGT ACTGATcCaA CAGGTGGTGC CGGCGTAATG GCTGATTTAA 180 

AATCATTTCA TTCATGTGGT GTATAT GGTA TGGGCGTCGT TACAAGTmTT GTTGCTCAAA 24 0 

ATACATTGGG CGTACAACAT ATTCATAATT TAAATCATCA ATGGGTAGAT GAACAACTTG 3 00 

35 ATAGTGTCTT CAATGATACC TTACCTCATG CTATTAAAAC GGGGATGATT GCTACAG CAG 3 60 

ATACTATGGA AACGATTCGT CATTATTTAA TGCAACATGA ATCTATTCCA TATGTAATt G 4 20 

ATCCTGTTAT GTTGGCGAAA rCggTGATTC ATaATGGwTA ATGACaCAAg CaAAACTTGC 4 80 

40 

AGCATaCGTT ATTGCCATTA GCTGACGTAG TAACACCGAA TTTACCAGAA GCTGAAGAAA 540 

TAACGGGACT AACCATTGAT AGTGAAGAAA AAATTATGCA GGCTGGCCGC ATCTTTATTA 600 

ATGAGATTGG TAGTAAAGGT GTCATCATTA AAGGCGGTCA TTCAAATGAT ACTGATATAG 660 

45 

CAAAAGATTA TTTATTTACT AACGAAGGTG TTCAAACATT TGAAAATGAA CGATTTAAAA 720 

CAAnACATAC GCATGGAACA GGGTGTACAT TTT CAGCAGT TATAACGGCA GAACTTGCAA 780 

50 AAGGTAGACC ATTATTTGAG GCTGTACACA AGGCTAAAAA GTTTATTTCA ATGAGTATAC 84 0 

AATATACGCC TGAAATCGGC CGTGGTAGAG GTCCAGTGAA TCATTTTGCA TATTTAAAGA 900 

55 



950 



EP 0 786 519 A2 



TGTTATACAA ACGATGTAGT TAAAAATTTT ACAGCGAATG GTTTATTAAG TATTGGTGCT 102 0 

AGCCCTGCAA TGAGTGAAGC TCCCGAAGAA GCTGAAGAAT TTTACAAAGT TGCACAAGCG 108 0 

CTATTAATCA ATATCGGTAC TTTAACAGCA GAAAATGAAC AAGATATTAT TGCGATTGCT 1140 

CAAACGGCAA ATGAGGCAGG CTTAC CTATT GTATTTGACC CTGTAGCTGT TGGTGCTTCT 120 0 

ACATATCGAA AGCAATTTTG TAAAT T ATT A TTGAAATCAG CGAAAGTATC AGTAATTAAA 12 6 0 

GGCAATGCAT CTGAAATATT AGCGTTGATT GATGATACAG CAACTATGAA AGGTACAGAT 132 0 

AGTGATGCTA ATCTTGATGC GGTTGCAATA GCGAAAAAGG tTACGCAACA TATAAAACTG 13 80 

CAATAGTAAT CACAGGTAAA GAGGACGTTA TTGtTCmAGA TAATAAAGCC TTCGTATTAG 1440 

CTAATGGATC TCCATTATTA GCACGAGTAA CTGGAGCTGG TTGTTTATTA GGAGGCGTTA 1500 

TTGCTGGATT TTTATTTAGA GAAACAGAAC CAGACATAGA AG CGTTAATT GAAGCGGTAA 156 0 

GCgkATTTAA TATTGCTGCT GAGGTAGCTG CTGAAAATGA AAATTGTGGT GGTC CTGGTA 162 0 

CGTTTTCACC ATTGTTGCTT GATACGTTAT ATCATTTAAA TGAAACAACC TATC 1674 
(2) INFORMATION FOR SEQ ID NO: 210: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2232 base pairs 

(B) TYPE: nucleic acid 
CO STRANDEDNESS: double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 210: 



ATGAGTTGCC 


GATGAATTTA 


GCACCACCAA 


CGATTGCnTT 


TGATACTGTG 


TCCCAACCAG 


60 


CTTGTTTAGC 


ATATTTAATA 


CCTTCACGTA 


AAGGATCGTT 


ATCATATGCA 


GCAAT AC CAA 


120 


ATACGTTATG 


GTATTTCGTG 


TTTGAGTTAG 


TTACAACTTT 


GTnTTGCACT 


ACATCTGCAC 


180 


ctttCgctaa 


TTGAGAAGTA 


CCGTTACCTG 


TTTCTAATAG 


GGCATGTGAG 


ATAAGATAAA 


24 0 


CTTCATTAAT 


GC CAT ACATT 


TGAGCAGCTT 


TGTTAAATGC 


AGCACCTTGG 


TTTTCTAATA 


300 


CACCTTTACC 


TTTTAAGAAT 


TGATTAATTT 


TATCAATAGA 


AATATTTTGT 


GGTTGGTCTA 


360 


agcgtaagaa 


TTGATATTTT 


AATGCTGGAT 


CTTGAGCTAA 


ACGCTTCGTA 


TCCATTGCAT 


420 


gcttaacatc 


ATTAAATTTA 


GCATCTGTCC 


ACTTACCTGG 


TACACGTTGT 


ACTTGTGGTT 


480 


tatattgtaa 


ACCAGCTTGT 


ATTTGAGCAA 


CTTGGTTTAA 


TGTCATACCT 


GTTTGATTAT 


540 


ACTTAATTAA 


TTCTTTAGCT 


AAATCAGTTG 


ATTTAATCCA 


TGCtAATTTA 


CCGTTAGATA 


600 


ATTTACCATA 


GTACCAAGTT 


TGTCCATTAA 


TGACTTGTTC 


TTTAACAACT 


GCGAATGGTT 


660 
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AACCATTACC 


ATTTTTAATT 


ACATAAGTGT 


AGTTATAATC 


TTTGGcAGCT 


GATGTAGTTG 


780 


GTTTCACAGC 


AGTTGGTGCA 


GTTAAATCTT 


TTGCATTTAC 


CCAACCAGTG 


CGGTTATTAA 


840 


TAGTACCGTA 


TAAATAAACA 


TCTTTGCCTA 


CAGATACTTG 


TTTCGTTGCA 


TTAAATGTAC 


900 


CTTGAGCAAT 


GTTATTGCCT 


GTTAAAATGA 


CTTGGTTTTT 


AGTACCCCAA 


GGAAC CATTG 


960 


ATAAGCCGTT 


ATTTGATTTA 


TTAACAGTAT 


ATTTTTGAGT 


CGTTTTAACT 


TCTTTGCCTA 


1020 


AGTTTTGAAC 


ATTTAAGTCT 


TTTACATTGA 


ACCAACCTAA 


TGGGATGTTA 


TGG CTTGTAT 


1080 


TGTTTAATAA 


TACATACGTT 


TCATTACCAT 


GAGCACGCTC 


TTTTGTTACA 


TAGAACGTAC 


1140 


GGTCTGCATA 


TTTCGCACCG 


TTTTTCGCTG 


TTTTTTCATA 


AACAGAAGCA 


CGAATACCAG 


1200 


TGTTGTTTGG 


TTTAACTTGA 


GCAATCTTGC 


TAACTGTTTG 


AGTCGTTTGT 


GGTTTAGTAA 


1260 


CAGTATAAGC 


TTTTACAGCT 


GTTTTTGGTT 


GTGCTACTGC 


TTTTTTAGGT 


GCAGCAGGTA 


1320 


CAGCTAAATA 


TGCTTTACTT 


ACCCAACCAG 


ATTTACCATT 


TACAGTTCCA 


AATAAATAGA 


1380 


TAGATTTATC 


AATTTGTTGT 


TGCTTAGTCG 


CTTTAAAAGT 


TTGGTTACCT 


GTACCAGAAA 


1440 


CTGCACCAGC 


TTCTTGTTTA 


TAAGTGCCCC 


AAGGTACTGA ATATAATTTA GTGCCTGGgT 


1500 


TTACTGTATA 


TGTTTGCATT 


ACATTTACAG 


GTGATTTTGC 


ATtGtTATAA 


ATACGTCACC 


1560 


TTGTTTAACC 


CAACCAATTA 


AAGTTGGACT 


ATTGTAATCT 


TTAACTAAGT AGAATTTGTT 


1620 


TCCACCTAAA 


CTTGCTTCTT 


TTGTTACAGC 


AAATGTTTTT 


TGAACTTCTT 


TCGTTGGCTT 


1680 


ACCAGTTTTG 


TCATAAACTG 


TAGTGAATAA 


GCCATTGTTT 


TTAGCATTAA 


TTTGAGCAAC 


1740 


ACCGTTTAAT 


GATGAAACTG 


TTAATTTATT 


ATTTGTTGTA 


GGTGTTGATG 


GCTTAGGTGT 


1800 


TGGTGTAGGC 


GTAGGTTTAG 


CAGTATCAAC 


TAAATATGCT 


TTACTTACCC 


AACCAGATTT 


1860 


ACCATTCACA 


GAGCCATATA 


AATAAATTGA 


TTTATCAATT 


TGTTGTTGCT 


TTGAAGCCTT 


1920 


AAATGTTTGG 


TTTCCAGAGC 


CAGACACACT 


ACCAGCAACT 


TGTTTAGATG 


TACCCCAAGG 


1980 


TACTGTATAA 


AGTTTCGTAC 


CAGGTTTGAT 


TGAATATGAT 


TGATTTACAT 


TTACAGGTGA 


2040 


TTTAGCTGTG 


TTGTAAACCA 


CATCGCCTTC 


TTTAACCCAA 


CCAAATTTAT 


TACCAGAATT 


2100 


GTAATCTTGA 


ACAAGATAGA 


ATTTTTGATT 


ACCTAATGTA 


GCTGTTTTAG 


ATACAG CAAA 


2160 


TGTTTTTTGA 


ACTTCATTAG 


TTGCTTTACC 


AGTTTTGTCG 


TATACAGTAG 


TATATAAACC 


2220 


ACTATTTGTT 


GG 










2232 


(2) INFORMATION FOR SI 


ZQ ID NO: 211 : 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2082 base pai: 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 211: 

GATTTAAATA AAATTAATGG ATATCGTGAT CGTACGATGT TAGAACTTCT GTACGCAACG 6 0 

5 

GGAATGCGTG TATCTGAATT GATACATTTA GAGTTAGAAA ACGTGAACTT AATAATGGGA 120 

TTTGTACGCG TATTTGGTAA AGGCGATAAA GAAAGAATTG TACCATTAGG CGACGCAGTC 180 

w ATTGAGTACT TAACTACTTA TATTGAAACG ATTAGACCGC AACTTTTAAA AAAGACTGTT 24 0 

ACTGAAGTCT TATTTTTAAA TATGCATGGT AAACCTTTAT CACGACAAGC AATATGGAAA 3 00 

ATGATTAAAC AAAATGGTGT AAAGGCAAAC ATTAAAAAGA CGTTAACGCC ACATACGTTA 360 

15 CGCCACTCTT TTGCGACACA TTTATTGGAA AATGGCGCAG ATTTAAGAGC AGTGCAAGAG 420 

ATGTtAGGtC ACTCTGaCmT ATCTACTACC CmaCTCTATA CmCATGTTTC GrAATCTCAA 480 

ATTAGAAAAA TGTATAACCA ATTTCATCCT AG AG CAT AAA GTGAACAATA ACTCAAAAGT 54 0 

CACAATACAC ATGACTAAAA ATGTCTGTGC TATTGTGGCT TTTTTAAATT GGTTGATTAA 600 

TTACGTCTAT GTTTTCTTAA TTGAATCGCT TCTTCTTTTG CTGCAATCAC TTCTGAACGA 660 

2s TCACGGCGCA TGTGATGGTC TACAATAAAA GGATCTGTTG CTGTTT CCTG ATTATAATCA 72 0 

TAGTCTGGAT AGTTGGCCTT GATGATGCGT TCAAAGACTG GAGTTATTGG T AATATAA CA 78 0 

GATGAAAAAG GCTTTGCTGC ATTCAATTTT GCAATCTGTT GCTCAATTAA CAACTGATAA 84 0 

30 TCATTTAAAT TAAGGTATAA CGCATCTCTA TCTTTAGCAT TTTGTATTAT TTCTTTAGAT 900 

TTATTAAAAG ACTTATAGGC G C CTTTT AAA TTATTGCGGC GATAATGGTA ACAAGCAGTT 960 

GCAAACAAGA TTAAACTAAC AACTGCATCT TGCTTACTGT AGTTATTTTC AGCTTTCCAT 1020 

35 GCATCTTCTA AAATGTCATG ACATAGGAAA TAATGTTGCT TAGTATGAAA TTGATAATAG 1080 

AAATTTATCA GTGCCTGTTG CATTTTGTTA TCACCCCAAT TTAAAAGTAA GTTATTTTCA 114 0 

TGCTATAATA TTTTAGAGAA TTATGCACAT ATGACGCAAT ACGAGGTAGA TATTATGTAT 120 0 

40 

GAAGTTAAAT TAGATGCTTT CAATGGACCA TTAGATTTAT TGCTGCATCT TATCCAAAAA 1260 

TTTGAAATAG ATATTTATGA TATTCCTATG CAAGCATTAA CAGAGCAGTA TATGCAGTAC 1320 

45 GTTCATGCAA TGAAACAGCT TGAAATTAAT ATTGCAAGTG AATACCTAGT ATTAGCGTCA 13 8 0 

GAACTCTTAA TGATTAAAAG TAAGATGCTA TTACCACAAT CAACATCAGA TATGGATGTT 144 0 

GATGATGACC CACGGGAAGA TTTAGTt GGG CGTTTAATAG rATATCaAAA TTATArAGAA 1500 

50 TATACTGCtA TTTTAAATGA CATGAAAGAA GAAAGAGATT TTTATTTTAC CAAAAAGACC 156 0 

GACAGATTTA TCtCATTTGG AAAcAGATGA ATCyTGGGAT CCaAATCATA CGATTGATTT 162 0 



953 



EP 0 786 519 A2 



ATCTGTTGAA ATCCGAAAAG AGACATTTAC CATTCAACAA GCTACAGAAC AAGTGACATC 174 0 

GAGATTGAAA GATAAAGATC ATTTTAACTT CTTTAGTCTG TTTACGTTTT CTGAG CCAAT 180 0 

5 

TGAACAAGTA GTCACTCACT TTTTAG CTAT TTTAGAGATG TCAAAAGCAG GAATAATTAA 186 0 

TATTGAGCAA CAACGTAATT TTGAAGATAT TAACATTATT AGAGGAGTGA ACTACCATTT 192 0 

w TGGATAATCA TGGTATATTA GAG TCG CTTT TATTTACAGC TGGCGATGAA GGTTTAGATG 19 80 

AAAAACAACT ATTAGAAATA TTAGATATGT CGAAAGACCA ACTCGTTGAA TTAATTGAAA 204 0 

ATTATTCATC ACATGGATTA ATGATACAAC GATTTGGAAT GA 2 0 82 

'5 (2) INFORMATION FOR SEQ ID NO: 212: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4219 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 212: 

TCTATTCTCG TTCTTCCAAG ACCCTGaATT AGAAGTTAAG AAAATCGAAG AAGATGAGAA 60 

AGAATCTATT AAAAAAGCTC AAAAAGGTAT TTATAAAGAC CCTAGAGACA TCAATGATGA 120 

CGAACAAGAT GATGATACAA AAGATACTGT TGATAAAAAG GAATGATTGT AATTGCCTAA 180 

CAAAAACACT CAAGAATATT GGGAAGAACG CGGACGCAAA GCAATCGAGA ATGAGTTGAA 24 0 

GCGTGATAAA ACTAAAGCTG AAGAAATAGA ACGTATATTG AATATGATGA TTAAG CGCAT 300 

TGAAAAAGAG ATCaATGCGT TTATTGTCAA GTACGGAGAT TTTGCAGGCG TTACATTACA 360 

AGAAGCACAA AAGATTATTG ATGAGTTCGA TGTAAAAGCG TTTCAAGAAG AAGCAAAAAG 4 20 

ATTGGTCGAA AACAAGGAGT TTAG CGATAG AGCAAATGAA GAATTAAAGA AGTATAACAC 4 80 

GAAAATGTAT GTATCTAGAG AACAGATGTT AAAGATTCAA ATAGAATTCT TAATTGCTTA 54 0 

TGCAACAGCT CAAACAGAAT TATCGATGAG GGAATATTTC GAATCAACAG CTTATCGTGT 60 0 

GTTCAGTGAT CAAGCGGGTA TTTTAGGTGA AGGTGTACAA GTAGCTAAAG AAGTTATAGA 6 60 

TACAATCGTT GATACACAAT TTCATGGTGT CGTTTGGTCA GAGCGATTAT GGACTAATAC 720 

CGAAGCAATG AAACAAGAAG TAGAAGAAAT AATTGCTAAT GTAGTTATTA GAGGTCGACA 780 

TCCTAATGAA TATGTTAAAG ATATGCGCAA CACTTAAATA AATTCGAAGG CACAGCACGA 84 0 

CAAAAGAC CG CAGCAATTAA ATCATTGCTT TATACGGAAT CGGCACGTGT TCACGCACAA 900 

TCAAGCATTG ACAGCATGAA AGAAATTTCA CCGGAAGgAT ATTATATGTA TATTGCAAAA 96 0 
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GACGCTAAAA TTGGTGTTAA TTTCTATCCT ATGCATATCA ATTGTCGTTC AGATTGCGCT 1080 

TTACTACCTA AATCTATGTG GCCGAAAAAA CCAAGCAAGA AACGAAAAAC AAAATACTTC 114 0 

GGAGGGAAAG TGAAAAGCGG TGATTGATTT AAAAGTGAAG TTTTTTAAAG GCAAGTTAGT 12 00 

TTTGTATGAC AG T AAATTAA ATGTTTGGAG GATACTAATA TGAGTAATAC TGACAAATAC 12 GO 

CTTAGAGACA TAGCAAGAGA ATTAAAAGGT ATACGTAAAG AGTTACAAAA GCGAAACGAA 13 2 0 

ACAGTTATTA TTGATGCAAA CTTAGACAGT TTAAGGTCGG CAGTATTAGC CGATAAAGAA 13 80 

AAATCGAAAT ATAATGAACC TCTCTTTTAA TAGCTAGCAC TTAATTGTGT TGGCTATTTT 14 4 0 

TTATGTCCAA AACGTGCTGA TGACATAAAA AGCACGCATG GAAAAACAGT CGACAGACTA 150 0 

TAAATGGAGG TATATCTCAT GGAAGAAAAT AAACTTAAGT TTAATTTGCA aTTTTTTGCA 156 0 

GACCAAT CAG ATGATCCGGA CGAACCAGGC GGAGATGGTA AAAAAGGAAA TCCTGATAAG 162 0 

AAAGAAAATG ACGAAGGTAC TGAAATAACT TTCACGCCAG AGCAACAAAA GAAAGTTGAT 168 0 

GAAATACTTG AACGTCGTGT AGCCCACGAA AAGAAAAAAG CTGATGAGTA TGCAAAAGAA 174 0 

AAAGCAGCAG AAGCTGCTAA AGAAGCTGCT AAATTAG CG A AAATGAACAA GGATCAAAAA 18 00 

GATGAATATG AACGCGAACA AATGGAAAAA GAACTGGAAC AATTACGTTC AGAAAAACAA 1860 

TTAAACGAAA TGCGTTCAGA AGCACGAAAA ATGTTGAGTG AAGCGGaAGT TGATTCATCA 1920 

GATGrGGTTG TCAATTTAGT TGTAACAGAT ACTGCTGAAC AAACTAAATT GAATGTTGAA 198 0 

GCTTTTTCTA ATGCAGTAAA AAAAGCGGTT AATGAAGCGG TTAAGGTTAA CGCTAGACAA 2 04 0 

TCGCCATTGA CTGGTGGAGA TTCATTTAAT CACTCGACTA AAAATAAACC GCAAAACTTA 2100 

GCTGAAATAG CTAGACAAAA AaGAATTATT AAAAATTAAC GGAGGCATTT AAATGGAACA 2160 

AACACAAAAA TTAAAATTAA ATTTGCAACA TTTTGCAAGT AACAATGTTA AACCACAAGT 222 0 

ATTTAACCCT GACAATGTAA TGATGCATGA AAAGAAAGAT GGCACGTTGT TAAACGACTT 22 8 0 

TACAACACCT ATCTTACAAG AGGTTATGGA AAACTCTAAA ATCATGCAAT TAGGTAAGTA 234 0 

CGAACCAATG GAAGGTACTG AGAAGAAGTT TACTTTTTGG GCTGATAAAC CAGGTGCTTA 24 00 

CTGGGTAGGT GAAGGTCAAA AAATCGAAAC GTCTAAGGCT ACTTGGGTTA ATGCTACAAT 24 60 

GAGAGCGTTT AAATTAGGGG TTATCTTACC AGTAACAAAA GAATTCTTGA ATTACACTTA 2 520 

TTCACAATTC TTTGAAGAAA TGAAACCTAT GATTGCTGAA GCTTTCTATA AAAAGTTTGA 25 80 

CGAGGCAGGT ATTTTGAATC AAGGTAACAA TCCGTTCGGT AAATCAATTG CACAATCAAT 264 0 

TGAAAAAACT AATAAGGTTA TTAAAGGTGA CTTCACACAA GATAACATTA TTGATTTAGA 27 00 

GGCATTGCTT GAAGATGACG AATTAGAAGC AAATGCATTT ATCTCAAAAA CACAAAACAG 2 760 
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TGATTCGTTA 


GACGGTCTAC 


CTGTGGTTAA 


CCTTAAATCA AGCAACTTAA AACGTGGTGA 


2880 


ATTAATCACT 


GGTGACTTCG 


ACAAATTGAT 


TT ATGGT AT C 


C CT CAATTAA 


TCGAATACAA 


2940 


AATCGATGAA 


ACTGCACAAT 


TATCTACAGT 








3000 


GTTTGAACAA 


GACATGGTGG 


CATTACGTGC 


AACTATG CAT 


GTAGCATTG C 


ATATTGCTGA 


30G0 


TGATAAAGCG 


TTTGCTAAGT 


TAGTTCCTGC 




A CAG ATT CAG 


TT C CAGG AG A 


3120 


AGTTTAATAA 


ATAATTAGGA 


GTGGTAACAT 


GCCCGAAATC 


ATTGGAATTG 


TTAAAGTAGA 


3180 


TTTTACAGAT 


TTAGAAGATA 


ACAGACATGT 


CTATATGAAA 


GGGCATGTCT 


ACCCTCGTAA 


3240 


AGGTTATAAT 


CCTACAGATG 


AACGTATCAA 


AGCTTTAGCT 


AGTGTTGAAA 


ATAAACG CAA 


3300 


CAAACAAATG 


ATTTACATTG 


TAAATGACAA 


ATTAACCAAA 


AAAGAACTTG 


TCGAAATAGC 


3360 


AAGTGTTGCT 


GGCTTACAAG 


TTGATGAAAA 


ACAAACAAAA GCTGAAATTA 


TCAATGCTTT 


3420 


TGAGTCACTA 


GAGTAGGTGG 


TTATATGACT ACGCTAGCTG 


ATGTAAAAAA 


ACGTATTGGT 


3480 


CTTAAAGATG 


AAAAGCAAGA 


TGAACAATTA 


GAAGAAATCA 


TAAAAAGTTG 


TGAAAGCCAG 


3540 


TTGTTATCAA 


TGTTACCTAT 


TGAAGTTGAA 


CAAATACCGG 


AAAGgTTTAG 


TTACATGATT 


3600 


AAAGAAGTTG 


CAGTTAAACG 


CTACAACAGG 


ATTGGTGCTG 


AAGtATGACA 


TCAGAAGCGG 


3660 


TTGACGGACG 


TAGCAATGCG 


TATGAATTGA 


ACGATT t CAA 


GGAGTATGAA 


GCTATTATTG 


3720 


ATAATTACTT 


TAATGCTAGA 


ACGAGAACTA 


AAAAAGGAAG 


GGCTGTGTTC 


TTTTGAGATA 


3780 


TGAAGATAGA 


GTTATTTTTC 


AATTAGAACA 


AGTAGCAACT 


TACAATCCTA 


AAAC TAG CAA 


3840 


AAAAGAAAAC 


ACACTAATCA 


CTTATG ATG C 


GATACCATGC 


AATATTAACC 


CCATTTCTAG 


3900 


AGCAAGAAAG 


CAACTTGAAT 


TTGGTGATGT 


AAAAAACGAT 


GTAAGTGTTC 


TGAGGATAAA 


3960 


AGAATCAATA 


TCTTACCCTG 


TTAGCCACGT 


GTTGGTTAAT 


GGCATTCGCT 


ACAAGATAGT 


4020 


TGATACAAGG 


ATATACAGAC 


ACGAAACGTC 


ATATTATATC 


GAAGAGGTCA 


ATTGATGAAT 


4080 


ATAGATGGAT 


TAGACGCACT 


GTTAAACCAA 


TTTCACGATA 


TGAAAACCAA 


CATTGATGAT 


4140 


GATGTAGATG 


ATATTTTACA 


GGAAAACGCC 


AAAGAATATG 


TAGTACGAGC 


TAAATTGAAA 


4200 


GCTAGAGAAG 


TAATGAATA 










4219 


(2) INFORMATION FOR SEQ ID NO: 213: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1999 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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GCTTACAAGT ATATTCATAA 


TTACATATTC 


AAGGTCCTTG CATGTGGTAT TTTGCTATGG 


60 




yCtTTaACTA CAACGGGGTC 


TAAGACTGCG 


TTTATCATAT TAATCGTCTT AGCCATTtAT 


120 




TyCTTTATkA AAAAGTTATT 


TAGTAGAAAT 


GCGGTAAGTG TTGTGAGTAT GTCAGTGATT 


180 




ATGCTGATAT TACTTTGTTT 


T AC CTTTTAT 


AATATCAACT ACTATTTATT CCAATTAAGC 


240 


w 


GACCTTGATG CCTTACCGTC 


ATTAGA TCGA 


ATGGCGTCTA TTTTTGAAGA GGGCTTTGCA 


300 


TCATTAAATG ATAGTGGGTC 


TGAGCGAAGT 


GTTGTATGGA TAAATGCCAT TTCAGTAATT 


360 




AAATATACAC TAGGTTTTGG 


TGTCGGATTA GTGGATTATG TACATATTGG CTCGCAAATT 


420 


15 


AATGGTATTT TACTTGTTGC 


CCATAATACA 


TATTTGCAGA TCTTTGCGGA ATGGGGCATT 


480 




TTATTCGGTG CATTATTTAT 


CATATTTATG 


CTTTATTTAC TGTTTGAATT ATTTAGATTT 


540 




AACATTT CTG GGAAAAATGT 


AACAGCAATT 


GTTGTAATGT TGACGATGCT GATTTACTTT 


600 




TTAACAGTAT CATTTAATAA 


CTCAAGATAT 


GTCGCTTTTA TTTTAGGAAT TATCGTCTTT 


660 




ATTGTTCAAT ATGAAAAGAT 


GGAAAGGGAT 


CGTAATGAAG AGTGATTCAC TAAAAGAAAA 


720 


25 


TATTATTTAT CAAGGGCTAT 


ACCAATTGAT 


TAGAACGATG ACACCACTGA TTACAATACC 


780 


CATTATTTCA CGTGCATTTG 


GTCCCAGTGG 


TGTGGGTATT GTTTCATTTT CTTTCAATAT 


840 




CGTGCAATAC TTTTTGATGA 


TTGCAAGTGT 


TGG CGTTCAG TTATATTTTA ATAGAGTTAT 


900 


30 


CGCGAAGTCC GTTAACGACA 


AACGGCAATT 


GTCACAGCAG TTTTGGGATA TCTTTGTCAG 


960 




TAAATTATTT TTAG CGTTAA 


CAGTTTTTGC 


GATGTATATG GTCGTAATTA CTATATTTAT 


1020 




TGATGATTAC TATCTTATTT 


TCCTACTACA 


AGGAATCTAT ATTATAG GTG CAGCACTCGA 


1080 


35 


TATTTCATGG TTTTATGCTG 


GAACTGAAAA 


GTTTAAAATT CCTAGCCTCA GTAATATTGT 


1140 




TGCGTCTGGT ATTGT AT TAA 


GTGTAGTTGT 


TATTTTTGTC AAAGATCAAT CAGATTTATC 


1200 




ATTGTATGTA TTTACTATTG 


CTATTGTGAC 


GGTATTAAAC CAATTACCTT TGTTTATCTA 


1260 




TTTAAAACGA TACATTAGCT 


TTGTTTCGGT 


TAATTG G ATA CACGTCTGGC AATTGTTT CG 


1320 




TTCGTCATTt AG CATACTT A 


TTACCAAATG 


GACAGCTCAA CTTATATACT AGTATTTCTT 


1380 


45 


GCGTTGTTCT TGGTTTAGTA 


GGTACATACC 


AACAAGTTGG TATCTTTTCT AACGCATTTA 


1440 




ATATTTTAAC GGTCGCAATC 


ATAATGATTA 


ATACATTTGA TCTTGTAATG ATTCCGCGTA 


1500 




TTACCAAAAT GTCTATCCAG 


CAATCACATA GTTTAACTAA AACGTTAGCT AATAATATGA 


1550 


50 


ATATTCAATT GATATTAaCA 


ATACCTATGG 


TCTTTgGTTT AATTGC aATT ATGCCATCAT 


1620 




TTTATTTATG GTTCtTTGGT 


GAGGAATTCG 


CATCAACTGT CCCATTGATG ACCATTTTAG 


1680 




CGATACTTGT ATTAATCATT C CTTTAAATA tGTTGaTAAg CaGGCAATAT TTAtTAAtAG 


1740 
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TATGTAyTAT TTTGATATAT TTTTATGGAA TTTACGGTGC TGCTATTGCG CGTTTAATTA 



1860 



CAGAGTTTTT CTTGCTCATT TGGCGATTTA TTGATATTAC TAAAATCAAT GTGAAGTTGA 



1920 



ATATTGTAAG TACGATTCAA TGTGTCATTG CTGCTGTTAT GATGTTTATT GTGCTTGGTG 



1980 



TGGTCAATCA TTATTTGCC 



1999 



20 



25 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 214: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7769 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 214: 

TCATTATTAA G AC T ATT AT A TATAATGAAT TTTAACTGGT TTATTAAACG AGAACGTCGG 60 

GAATTAAGTA ACTACAATAA AAATAAGATA TGACAATAAG GAGACTACAC GCGTGATCAT 12 0 

TGCCATAATT ATATTGATAT TTATTTCGTT TTTCTTTTCA GGAAGCGAGA CGGCATTAAC 180 

GGCTGCCAAT AAAACAAAAT TTAAAACTGA AGCTGACAAA GGTGATAAAA AAGCAAAAGG 24 0 

CATTGTAAAG TTACTTGAAA AACCAAGTGA GTTTATTACA ACGATTCTAA TTGGGAATAA 300 

TGTCGCGAAT ATTTTATTAC CAACACTTGT TACAATTATG GCTTTACGTT GGGGGATTAG 3 60 

CGTTGGTATT GCATCAGCTG TTTTAACAGT TGTTATCATT TTGATCT CCG AAGTGATTCC 420 

CAAGTCTGTC GCTGCAACAT TTCCAGATAA AATAACAAGG CTTGTATATC CAATTATTAA 480 

TATTTGTGTC ATTGTGTTCC GTCCTATCAC ATTACTTTTA AATAAGTTGA CGGACAGTAT 54 0 

TAATCGAAGT TTATCTAAGG GCCAACCTCA AG AACAT CAA TTTTCAAAAG AAGAATTTAA 600 

AACAATGTTA GCAATTGCTG GACATGAAGG TGCTTTAAAT GAAATTGAGA CGAGTAGGTT 66 0 

GGAAGGTGTC ATTAATTTTG AAAATTTAAA AGTAAAAGAT GTAGATACAA CACCTAGAAT 720 

TAATGTGACG GCATTTGCTT CAAATGCGaC ATACGAAGAA GTTTATGAAA CGGTTATGAA 780 

TAAGCCATAC ACTAGATATC CAGTGTACGA GGGAGATATT GATAACATTA TTGGGGTGTT 84 0 

TCATTCTAAA TATCTGTTGG CTTGGAGTAA TAAAAAAGAA AATCAAATTA CAAACTATTC 900 

AGCTAAGCCA TTATTTGTGA ATGAACACAA TAAAGCTGAA TGGGTATTAC GTAAGATGAC 960 

TATTTCTAGA AAACATTTAG CAATTGTGTT GGACGAATTT GGTGGTACTG AAGCGATAGT 102 0 

GTCACATGAA GACTTAATTG AAGAATTATT AGGTATGGAA ATTGAAGATG AGATGGATAA 108 0 

AAAGGAAAAA GAAAAACTTT CTCAACAGCA AATTCAATTT CAACAACGGA AAAATCGCAA 114 0 
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GTATTGAATA TCCAATTATA CAAGCAGGTA TGGCAGGAAG TACGACACCG AAATTAGTTG 1260 

CATCAGTAAG TAACAGTGGT GGGTTAGGCA CAATAGGCGC AGGTTACTTT AATACGCAGC 1320 

AATTGGAAGA TGAAATAGAT TATGTACGCC AATTAACG T C AAATTCTTTT GGCGTAAATG 13 80 

TCTTTGTACC AAGTCAACAA TCATATACCA GTAGTCAAAT TGAAAATATG AATGCATGGT 14 4 0 

TAAAAC CTT A TCGACGCGCA TTACATTTAG AAGAGCCGGT TGTAAAAATT ACCGAAGAAC 150 0 

AACAATTTAA GTGTCATATT GATACGATAA TTAAAAAGCA AGTGCCTGTA T GTTGTTTTA 156 0 

CTTTTGGAAT TCCAAGCGAA CAGATTATAA GCAGGTTGAA AGCAGCGAAT GTCAAACTTA 162 0 

TAGGTACAGC AACAAGTGTT GATGAAGCTA TTGCGAATGA AAAAGCGGGT ATGGATGCTA 1680 

TCGTTGCTCA AGGTAGTGAA GCAGGTGGAC ATCGTGGTTC ATTTTTAAAA CCTAAAAATC 174 0 

AATTACCTAT GGTTGGAACA ATATCTTTAG TGCCACAAAT TGTAGATGTC GTTTCAATTC 1800 

CGGTCATTGC CGCTGGTGGA ATTATGGATG GTAGAGGAGT TTTGGCAAGT ATTGTCTTAG 1860 

GTG CAGAAGG GGTACAAATG GGCACCGCAT TTTTAACATC ACAAGACAGT AATG CATCAG 192 0 

AACTACTGCG AGATGCAATT ATAAATAGTA AAGAAACAGA TACAGTCATT ACAAAAGCGT 1980 

TTAGXGGAAA GCTTGCACGC GGTATCAACA ATAGGTTTAT CGAAGAAATG TCCCAATACG 204 0 

AAGGCGATAT CCCAGATTAT CCAATACAAA ATGAGCTAAC AAGTAGCATA AGAAAAGCCG 2100 

CAGCAAACAT CGGCGACAAA GAGTTAATAC ATATGTGGAG TGGACAAAGC CCGCGACTAG 216 0 

CAACAACGCA TCCCGCCAAC ACCATCATGT CCAATATAAT CAATCAAATT AATCAAATCA 222 0 

TGCAATATAA ATAATCGACC GC AATCCACA AAAGCACAAG CACCCCCAAA CATTATTTTA 2280 

GTGCTTGCCA TTTTTGTGGA TTGCGTTTCT ATTTTACCAA TTTAATCAAA C G AAAACAT C 2340 

AAGCTGAAGA TCGCCGAAAG ATTTTAATCA AGCAAAAACA TCAAACTAAA GTTCGCTGAA 24 00 

ATGATTATGA TAAAAGTTAT ATGGTATGAT GACATTGGTG ATATATATGA TAAACATCGG 24 60 

ATTAACAGGT TGGGGTGATC ACTATTCATT ATATGAAGAT TTAGAACGCC AAACCGATAA 2 520 

ACTTAAAACA TATGCTGGAC ATTTTCCGGT TGT CGAATTA GATGCGACAT ACTATGCGAT 2580 

ACAACCGGAA AGAAATATAT TGAAATGGAT AAAAGAAACG CCTGATACAT TTGAATTTGT 264 0 

GGTCAAAATT CATCAAGCAC TcACATTGCA TGCAGACTAC AAAACATTTG CAGATACAAG 2700 

GCAAGAACTA TTTGATCAAT TTAAGAATAT GTTAGAGCCC TTACATACAC AGAAAAAATT 2760 

AGCAATGGTA TTGGTTCAAT TTCCGCCATG GTTTGACTGC AATGCACAAA ATATCAAATA 2820 

TATTTTGTAT GTAAGACAGC AATTACAAGC ATTTCCAATG TGTGTAGAAT TTAGGCATCA 2 880 

ATCATGGTTT AGTGATGCAT TTAAAGAACA AACATTGGCA TTTTTAACAG AACATCAAAT 2 94 0 
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AATCACAAAT GAAATTGCGT TTGTACGTTA TCATGGACGT AATCATTACG GTTGGACTAA 3060 
GAAAGATATG TCAGATCAAG AATGGCGCGA TGTACGCTAT TTATATGATT ATAATGAGCA 312 0 

AGAATTAATA GACTTGGCAC AAAAGGCACA AATATTAGCA CAAAAAGCTA AGAAAGTTTA 3180 
CGTCATATTT AACAATAATT CTGGTGGTCA TGCAGCAAAT AATGCCAAAA CATATCAGCG 324 0 

ATTATTGAAT ATAGAATATG AAGGGTTAGC ACCACAACAA TTAAAATTAT TTTAAGAGGC 33 0 0 

GACGACTATG TTATTAACAA TTACATTATT AGTTTTAATC GGAGGTTTGT CAG CGATT AT 33 6 0 

AGGGTCTATC GTAGGCATTG GAGGCGGTAT TATTATCGTT CCAACAATGG TTTACCTCGG 34 2 0 

TGTTGAACAT GGATTACTAC ATAATATTAC AACACAAGTA GCGATAGGGA CGTCTTCAGT 34 80 

CATTCTAATT GTGACAGGAC TTTCTTCATC ACTTGGATAT TTAAAAACAA AACAAGTTGA 3540 

TATTAAAAAT GGTTCCATCT TTTTATTTGG ACTATTACCA GGTTCATTGC TTGGGTCCTT 36 00 

CATTAGTAGA TATTTAACAT TTGAGTCATT TAATTTATAT TTTGGTATCT TTTTAATTTT 3660 

CGTAGCCATT TTATTAATGG TAAGAAATAA GATTAAACCG TTTAAAATTT TCGATAAACC 3720 

CAAGTATGAA AAGACTTATG TAGACGCTAA AGGTAAAACA TATCATTATA gTGTTCCACC 3 7 80 

ATTGTTTGCT TTTATTACAA CGTTTTTAAT TGGTATATTG ACAGGTTTAT TTGGTATTGG 3 840 

AGGTGGCGCA CTAATGACGC CACTAATGCT TATTGTATTT AGATTTCCAC CTCATGTAGC 3 900 

TGTTGGAACA AGTATGATGA TGATTTTCTT TTCAAGTGTC ATGAGTTCTA TAGGGCACAT 3 960 

TGCTCAAGGT CACGTAGCTT GGGGTTATGC AATCATnTTA ATTATTTCTA GTTATTTTGG 4 020 

TGCGAAAATC GGTGTCAAAG TGAATCAATC AATTAAGTCA GATACGGTAG TAACATTATT 4 0 80 

GAGAACAGTA ATG TTGTTAA TGG GTATATA TTTAATTATT CGTGCGTTGA TTTAATACAA 414 0 

CTTTAAAAGG AGGACGTCAA TTTGAGGCTT ACAATTTATC ATACGAACGA TATTCATAGT 4 200 

CATTTACATG AATACGAACG CATTAAAGCA TATATGGCAG AACATCGGCC ACGACTTAAT 4260 

CATCCTTCTT TATATGTTGA TCTAGGTGAT CATGTAGATT TATCCGCACC TATAACTGAA 43 20 

GCAACTTTAG GTAAAAAGAA TGTGGCATTA CTAAATGAAG CAAAATGTGA TGTTGCAACA 43 80 

ATCGGTAATA ATGAAGGGAT GACCATTTCA TACGAAGCTT TAAATCACCT TTACGACGAA 44 4 0 

GCAAAATTTA TAGTGACATG TAGCAATGTT ATAGATGAAT CAGGTCATTT ACCAAATAAT 4 500 

ATCGTTTCTT CTTATATTAA GGACATAGAC GGTGTGAAAA TACTATTCGT TGCAGCGACA 456 0 

GCACCTTTTA CCCCATTTTA TCGTGCACTA AATTGGATTG TTACCGATCC ACTTGAAT CT 4620 

ATAAAAGAAG AAATTGAACT TCAACGAGGT AAATTTGATG TATTAATCGT G CTAAGT CAT 468 0 

TGTGGCATTT TCTTCGATGA AACATTATGC CAAGAATTGC CTGAAATTGA TGTCATTTTT 474 0 
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GCAgCTGGAA AGTATGGTAA TTATCTTGGA GAGGTTAATT TAACTTTTGA GGCACATAAA 4 8 60 

GTAGTACATA AAACTGCAAA GATTATTCCT TTAGAAACAT TACCTGAAGT TGAAACTTCA 4 920 

TTTGAAGAAG AAGGAAAAAC GTTAATGTCC AATTCAGTAA TTCAACATCC AGTAGTGCTT 4 9 80 

AAGCGTAGTA TGAATCACAT AACTGAAGCT G CAT ACTT AT TAGCTCAAAG TGTTTGTGAG 5 04 0 

TATACACATG CACAATGTGC CAT CATCAAT GCTGGCTTAC TCGTTAAAGA TATTGTAAAA 5100 

GATGAAGTGA CAGAATATGA CATTCATCAA ATGTTACCGC ATCCGATTAA TATGGTAAGG 5160 

GTTAGACTTT TTGGTGTGAA ATTAAAAGAG ATTATAGCTA AAAGTAATAA ACAAGAATAT 5220 

ATGTATGAAC ATGCACAAGG TTTGGGTTTC AGAGGGAATA TATTTGGAGG ATATATTCTT 52 30 

TATAATTTAG GGTACATTCA TTCTACAGGG CGTTACTATC TGAATGGAGA AGAAATCGAA 534 0 

GACGACAAAG AATATGTACT AGGTACGATA GATATGTATA CGTTCGGTCG TTATTTCCCA 54 00 

ACATTGAAAG AATTACCAAA AGAGTATTTA ATGCCAGAGT TTTTAAGAGA TATATTTAAA 54 6 0 

GAAAAATTAT TGGAATATTA AAAAG TAAG A TTATTGGATT TTCATTTGTC ATGAATTTCG 5S20 

ATATAATGTT TAAAGATACA CTTAACAGGA GGGTATGTGT TGTTATGGCG ACAAAAAACG 5580 

AGGAAATATT ACGTAAACCG GATTGGTTGA AAATAAAATT AAATACCAAC GAAAACTATA 5640 

CAGGACTTAA GAAGATGATG AGGGAAAAAA ATCTTAATAC TGTATGTGAA GAAGCTAAAT 5700 

GTCCTAATAT ACATGAATGT TGGGGTGCAC GTCGTACAGC GACATTTATG ATTTTAGGTG 576 0 

CCGTATGTAC AAGAGCTTGT CGTTTTTGTG CGGTTAAGAC AGGTTTACCT AATGAACTTG 58 2 0 

ATTTAAATGA GCCTGAACGT GTAGCTGAAT CAGTTGAATT AATGAATTTG AAACACGTTG 5880 

TTATCACTGC TGTTGCGCGT GATGATTTAA GAGATGCTGG TTCAAATGTT TATGCTGAGA 5 94 0 

CAGTACGTAA AG TT AG AG AA AGAAATCCAT TTACAACGAT TGAAATTTTA CCATCAGATA 6000 

TGGGCGGGGA CTATGATGCG TTAGAAACAT TAATGG CGTC AAGAC CTGAC ATTTTAAACC 606 0 

ATAATATTGA AACTGTTCGT CGCTTAACAC CGAGAGTTCG TGCGCGTGCG ACTTACGACA 6120 

GAACATTAGA GTTTTTACGT CGTTCAAAAG AATTACAACC GGATATCCCA ACTAAATCAA 6180 

GTATTATGGT TGGATTAGGT GAAACTATAG AAGAAATTTA TGAAACGATG GATGATTTAC 624 0 

GTGCGAATGA TGTAGATATT TTAACGATTG GTCAATATTT ACAACCTTCA CGTAAACATT 630 0 

TAAAGGTTCA AAAATATTAC ACGCCTTTAG AGTTTGGTAA ATTAAGAAAA GTGGCAATGG 636 0 

ATAAAGGGTT TAAACATTGC CAAGCTGGAC CTTTAGTACG TAGTT CTTAT CATGCGGATG 64 2 0 

AGCAAGTAAA TGAAGCTGCT AAAGAAAAGC AACGCCAAGG TGAGGCACAG TTAAATAGTT 64 80 

AATATTTAAC CATTAATAAG GCATAAAGGC TTAGTTTGTA CAAAACGAAC GTGTCATAGA 654 0 
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AGGTGAAGAA TTTGATAAAA GTAGATCAAC ATTACTTTGA ATTAATAGAA AATTATCGCG 6 6 60 

AATGTTTTAA TGAAGAACAA TTTATTGCTA GGTATTCAGA TATTTTAGAT AAATATGATT 6 720 

ACATAGTTGG TGACTATGGT TACGATCAAT TACGATTAAA AGGTTTTTAC AAAGATTCTA 678 0 

ATAAAAAAGC AGAGATGAGT AAACGTTTTT CAAATATTCA AGATTACATA TTTGAATATT 6 84 0 

GTAACTTTGG TTGTCCTTAC TTTGTATTAA GACATTTGTC TAAACAAGAG GTTAAAAAGT 6 900 

TAATCGAAGA AGTTCATCCG TCTGATGTGA TAGATGACGA CAATAAACTT CAAGATGTGA 6960 

AGATTAAGCC AACCATT CAA GATACTGAAC ATTAATAAAA CCCTTAGCTA GATTGAAAAT 7 020 

GGGAATCATG CAATTCAAGC ATGGACCTGT AATCTAGTTA GGGGTTTTTA TCTTTAATGA 7 080 

ATGACTTCAT TTAAATACTC AGTAATTTCA TCGCCTTCTT CAGCATTTAC ACCTAAAATA 714 0 

TGAGCGATAT AGCCTTCTTC TTTTAAATCA TCAGTACCGA TAATACCGAA TTTATTTGTT 72 00 

TGCATATTAA GTACGAGTGT CTTAC CATAA TGTCTATTTG TATGGACTAA CATCAAATCA 72 6 0 

TATCGACTAT GCTCGCCAAC AAAACCAACA AACTGAACTT GACTCTCTTC GTTGTCATCA 7 320 

TATAAATACA TATCAATCAT TTTGTAGCGA CTCCTTTTAA AAGTAGTAAA GTTAGTATAA 7380 

CGACAAATGA AGTATACTGC AAAATTATGA TAATATATAA GTGAGAGGTG ACAAGGAATG 744 0 

TATTTTGTAG ACAAAGATAA ACTAACTCAG AAATTAGCCT ATTTACAAGC ATTAACTGAT 75 00 

GATTATCATG AGAGCAAGCA CAATCATTAT GCATTTGAAC GCATTGCTCA AATGTTGATA 756 0 

GAATCATCGG TAGATATAGG GAATATGATT ATCGATGCAT TTATTTTAAG GGATCCTGGT 7620 

AATTATAAAG ATGTGATTGA TATATTAGAA CTAGAAAATG TTATTACTAA AGAAACACAG 76 80 

CAGGCGATTA ATAAAACTGT CGGTATTCGT AAACAATTTA CATATGATTA CACAGCCTTA 774 0 

GATGTTGAGA TTATCATGCC AATGTTTGA 77 6 9 
(2) "INFORMATION FOR SEQ ID NO: 215: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 64 4 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO : 215: 

ACCGCCACCC ATTAATGATT GCTTAAAATC AATAGTCGTA C CATTTAAT A CGGGTGCATC 60 

TTTTTTGTCT ACTAATACTT TTAATCCAAA GTATTCTAAG ACTTCATCAT TTTCACCAGG 12 0 

CGCTTCTTCT GCACCCATAC CGTATGTTAA ACCAGTGCAC CCGCCACCAT TCACTTTAAT 180 
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TGCTTCTGTT AATATAACTG TTGGCATGAT AACTCCTCCT TAAAAAATCC AAGTTTCTTT 3 00 

TATATGTGCA TATATATTTT GTAATAATTC TTCCGGCGAA TCACCTTCAA CAATATCACC 3 60 

5 

ATTTACTAAA GCATACAACC CGGCTGAACA TATACCACAA TGTGTCAGGC AACCATACTC 4 20 

TAACACATCG ACATCTGGGT CATTTTCCAG TTGATTAAAA ACATAATCTC CACCTTTTGC 4 80 

CATGTTAGAG AGACAAAATT CTACGATCGG ATTCATACTT CACCTTCTTA TTTCATTTGT 54 0 

10 

TACAATATTA TAGCATTTTA AAACTGGTAT TTTAACATGA TGTGCTCAAT TAGCAACAAC 60 0 

TGATGTTTCT TATC C CAGTT ATGTAATAGT GCCTTAGTTA GTAC 6 44 
15 (2) INFORMATION FOR SEQ ID NO: 216: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 157 8 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
20 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 216: 
GAATGATGAA AGGAATAGAA AAGAAAAGAT AAATAATGTA ATAGATTTAT CCGAGAAAAT 60 

TGAAAGAACA AAAGATATGC CAATCAAGAA TACTATAACT ACTCAATTAG GAAATAAACT 120 

TATTGGCACA AAAAAAGCTC GTTTTGATGA TAAGAAAGTA GTGTCGTTTG GAGCATTTGA 180 

AGATGAATAA AATAAATGAT AGAGATTTAA CAGAATTGAG TAGCTATAGG GTTT AT CAAG 24 0 

ACATCAATAA AGATAATGAC TTTACAGTTA ACGAAAAACG ATTTAAGCAG GCAGATGTAT 3 00 

TTGAAGATTT ATATAGAGAG AAACTAAAAG ACACAAATAA ATTAAGAGAG TATAATTATT 3 60 

TACAAAATGA AACTTTTAAA AGCGCATAAA TAGGTGATGA GATATGCTTA AAAAAGCAAA 4 20 

ATTT2LTCTTA ATGGCAACGA TACTACTATC AGGATGTTCA ACTACCAATA ACGAATCCAA 4 80 

CAAAGAAACA AAATCTGTAC CAGAAGAAAT GGATGCTTCA AAATATGTAG GACAAGGATT 540 

CCAACCACCT GCAGAAAAAG ATGCGATTGA ATTTGCAAAG AAGCATAAAG ATAAAATTGC 600 

TAAGCGAGGC GAACAATTTT TTATGGATAA CTTCGGTCTA AAAGTTAAAG CTACAAATGT 660 

TATAGGTAGT GGCGATGGTG TAGAAGTATT CGTGCATTGT GATGACCACG AyATCGTATT 720 

TAATGCGAGT ATTCCATTTG ATAAATCAAT wATTGAsAGT GATAGCTCAT TAAGAAGTrA 7 80 

GGAyAAAGGy GATGATATGA GTACTTTAGT TGGTGCAGTA CTCAGTGGGT TTGAATATCG 840 

AGCACAAAAA GAAAAATATG ATAAATTATA TAAATTTTTC AAAGATAATG AAGAGAAATA 900 

TCAATATACA GGATTTACAA AAGAAGCAAT TAATAAGACG CAAAATAGTG GTTATGAAAA 960 
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ACCATTGTTA AACAAAAGTG ACAGTGAATT TTCAAAAGAA TTGTCAAATG TTAAGAAGCA 

ATTAAAAGAT AAGTCTAAAG TTTCGGTAAC TACTACTCTA TTTAGTAAAA AAAAGAACTA 114 0 

TACTAAAAAA AGTAACAGTG AAAATGTAAT AAAAATGGCA GAAGAAATAA AAAAAGATAA 12 0 0 

AGAGATACCA AACGGTATAG AGCTTAGTAT AAAATTTTCG GACAATAAAA TAAATACGGT 126 0 

TAAACCAAAT TTTAACGGTG aAAGCACTTC AGAATATGGT GTGTTTGATC AAGAATAAAA 13 20 

TTAATGATGa AAATTTAACG GAGAATAGTG TATATTGAGT AGATCmAGAA TAAAAAGATA 13 80 

ATTCTACTAT TGTTGTGAAG GCAAATAAGT AGAAGATTTT AAGTG TAATT TCTGGTGATT 144 0 

TAAATAATAA TATAnATGGn AGTACTGATA TAAnACTTTT TAACCTACTA GATTCTTATA 1500 

ATTTGCTTTC CATTTTATGA CGATTTTTAC TCCAATTGAG TGATAGAATC CAAAAAAGCC 15 6 0 

ATCTCCAAAA ATTAATCC 1578 

(2) INFORMATION FOR SEQ ID NO: 217: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 5137 base pairs 
(8) TYPE: nucleic acid 

(C) STRAND E DNE SS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 217: 

TGTTTTCCTT GGGTTAAAAC ATGCTTGCTA TGCGTTTGTA AATATGACTT GCTGTTTTnA 60 

CCTGnATACC CGTCACACCA TGGAAGTAAA AATGTTTCTT GCTCTTGGCT TACAATTTTA 12 0 

GCTTTAATCG CTTCATATGC TTTATATTGG TCTTCTGTTA ATTGCTGTTT TGATTCTTGT 180 

TCGAAAACAC GATCTTTAAA TGGGTCTCTT TCAACAACCG CGTCATATTT TTCAACATAA 240 

CCTTTTTTGA TAAGTC CATC TAAACTGGAT TTTGAAAAGC CCATATCCTC AATAT CAGTT 3 00 

AAAAATATTG TTTTATGTTG TTCTTCAGAC AAGTAAGCAT ACAAATCGTA TTGTTTAATA 360 

ACTTTCTCCA ACTTAGCTAA TACTTCATCA GGATGATACC CTTCAATGAC ACGAACAGCA 42 0 

CGCTTGGTTT TTTTAGTTAT ATTTTGTGTG AGAATCGTTT TTTCTTCAAC GATATCATCT 4 80 

TTTAACAACT TCATAAGCAA TTGAATATCA TTATTTTTTT GCGCATCTTT ATAATAATAG 54 0 

TAACCATGCT TATCAAATTT TTGTAATAAA GCTGAAGGTA GCTCTATGTC ATCTTTCATC 600 

TTAAATGCTT TTTTATACTT CGCTTTAATA GCACTCGGAA GCATCACTTC TAGCATAGAA 660 

ATACGTTTAA TGACATGAGT TGAACCCATC CACTCACTTA AAGCTATTAA TTCTGATGTT 720 

AATTCTGGTT GTATATCTTT CACTTCTATG ATTTTTTTTA ACTTCGAAAC GTCAAGTTGT 7 80 
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ACAATTACAC GCACACCAGG TTGGATGACA GATTCGAGTT GTTCGGGAAT TATATAATCA 90 0 

AATTTATAGT CAACGCTCTT CGACGCGACA TCGACTATGA CTTTCGCTAT CATTATTGCC 9 60 

ACCTAGTTTC TAGTTCATCT AAAATTTGTG CAGCTAATAC TACTTTTTTT CCTTTCTTGA 102 0 

TATTTACTTT TTCATTATTT TTAAAATGCA TTGTCAATTC ATTATCATCA GAACTAAATC 1080 

CGATAGACAT ATCCCCAACA TTATTTGAAA TAATCACATC TGCATTTTTC TTGCGTAATT 114 0 

TTTGTTGTGC ATAATTTTCA ATATCTTCAG TCTCTGCTGC AAAGCCTATT AAATACTGTG 12 00 

ATGTTTTATG TTCACCTAAA TATTTAAGAA TGTCTTTAGT ACGTTTAAAA GATACTGACA 12 60 

AATCACCATC CTGCTTTTTC ATCTTATGTT CTAATACATC AACCGGTGTA TAGTCAGATA 13 20 

CGGCTGCTGC TTTTACAACA ATATCTTGTT CGTCAAATCG GCTTGTCACT TGTTCAAACA 13 80 

TTTCTTCAGC ACTTTGAACA TGAATAACTT CAATATCTTT TGGATCCTCT AGTGTTGTAG 144 0 

GACCAGCAAC TAACGTCACG ATAGCTCCTC GATTTCGCAA TGCTTCAGCT ATTGCATAGC 1500 

CCATTTTTCC AGAAGAACGA TTGGATACAA ATCTGACTGG ATCGATAACT TCAATAGTTG 1560 

GTCCTGCTGT AACCAATGCG CGTTTATCTT GAAATGAACT ATTAGCTAAA CGATTACTAT 16 2 0 

TTTGAAAATG AGCATCAATT ACAGAAACGA TTTGAAGCGG TTCTTCCATA CGTCCTTTAG 168 0 

CAACATAACC ACATGCTAGA AATCCGCTTC CTGGTTCGAT AAAATGATAC CCATCTTCTT 174 0 

TTAAAATATT AATATTTTGC TGCGTACGTT TATTTTCATA CATATGCACA TTCATAGCAG 18 0 0 

GCGCAATAAA TTTCGGTGTC TCTGTTGCTA GCAACGTTGA TGTCACCAAA TCATCAGCAA 186 0 

TACCTACACT CAATTTTGCA ATTGTATTTG CCGTTGCAGG TGCAACAATG ATTGCATCTG 192 0 

CCCAATCACC TAATGCAATA TGCTGTATTT CTGAAGGATT TTCTTCTATA AAAGTATCTG 198 0 

TATAAACAGC ATTTCGACTT ATTGCTTGAA ATGCTAATGG TGT CACAAAT TTTTGTGCGT 2 04 0 

GATTSGTTAA CATAACGCGA ACTTCATACC CAGATTGTGT TAACTTACTT GTCAAATCAA 210 0 

TTGCTTTATA TGCCGCAATG CCACCTGTAA CGGCTAATAA TATTTTCTTC ATATTCAATC 216 0 

TCCCTTAAAT ATCACTATGA CATTTACGCT TTACATCATC ATATGCGCAC AAATGCTCAT 222 0 

TACTTTTTTA TAGATACAAA TTTAGTATTA TTATAACATC AATCATTGGA TAAACTAAAA 228 0 

AAACACACCT ACATAGGTGC GTTTGATTTG GATATGCCTT GACGTATTTG ATGTACGTCT 234 0 

AGCTTCACAT ATTTTTAATG GTCGAAACTA TTCTTTACCA TAATAATCAC TTGAAATAAC 2400 

AGGGCGAATT TTACCGTCAG CAATTTCTTC TAACGCTCTA CCAACTGGTT TAAATGAATG 24 60 

ATATTCACTT AATAATTCAG TTTCAGGTTG TTCATCAATT TCACGCGCTC TTTTCGCTGC 252 0 

AGTTGTTGCA ATTAAATACT TTGATTTAAT TTGTGaCGTT aATTGGTTtA AAgGTGGATT 258 0 
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TTTArGTGcT CAGCTTCTAC AATACATTGA ATTCtATTCy TCGcAAGtTC TACTTCAt CA 2700 

TTAACTACAA cGTAAyCGTA TAAATTCATC ATTTCrACTT CTkTACGCGC yTCGTTAATA 276 0 

5 

CGACTTTGTA TTTTCTCATC AGATTCTGTT CCTCTACCTA CTAATCGCTC TCTCAAGTGT 2 82 0 

TCTAAACTTG GAGGTGCTAA GAAAATAAAT AGCGCATCTG GAAATTTCTT TCTAACTTGC 2880 

io TTTGCACCTT CTACTTCAAT TTCTAAAAAT ACATCATGAC CTtCGTCCAT TGTATCTTTA 294 0 

ACATATTGAA CTGGTGTACC ATAATAGTTG CCTACATATT CAGCATATTC TATAAATTGG 3000 

TCATCTTTGA TTAAAGCTTC AAACG CATCC CTAGTTTTAA AAAAGTAATC TACGCCATCA 3060 

is ACTTCACCTT CAC GCATTTG ACGTGTTGTC ATTGAAATAG AATACTTATA TGATGTACTT 3120 

GGATCTTCAA ATATnCGTnT TCTAACAGTA CCTTTACCTA CTCCAGATGG TCCTGATAAA 3180 

ACGATTAACA ATCCTTTTTC ATTATCCATG CCTTACGACC TCTCTAAGCT AATCTTCTAT 324 0 

20 TATTTAAATA TGATATCACA TTGTTCTTTA TATTGTATAG CATATTTGAA ATTGCATGCC 33 0 0 

ATAATTTCTA TTAAGTCTAA CAATATCGTT ATATTGCACG ATTAATTTTA ATTAAATAAA 33 6 0 

TTGAATTGCA AACTTTTAGA TAATGTAAAA TGTATGGCAT AATGTATGGT TCAATAACTA 34 20 

25 

TACTGAAAAG TTACAAT CAT GTTAAAATGA AACGAATGAT ATGAAGAAGG TGGAAGATAA 34 80 

ATTATGGCTT ATGATGGCTT ATTTACAAAG AAAATGGTTG AGTCTCTACA ATTTTTAACA 3 54 0 

30 ACAGGACGTG TTCACAAAAT CAATCAACCT GATAATGACA CGATACTAAT GGTTGTACGT 3600 

CAAAATAGAC AAAACCATCA ATTGTTATTG TCAATCCATC CAAACTTTTC AAGATTACAA 366 0 

TTGACTACTA AAAAATATGA TAATCCATTT AATCCACCCA TGTTTGCGCG TGTTTTTAGA 3 72 0 

35 AAACACTTAG AAGGTGGTAT TAT CGAATCG ATTAAGCAAA TTGGTAATGA TCGTCGCATT 3 780 

GAAATCGATA TAAAGAGTAA AGATGAAATT GGCGATACTA TTTACCGCAC TGTCATCCTT 3 840 

GAGATTATGG GTAAACATAG TAACTTAATT TTAGTAGATG AAAATCGCAA AATAATTGAA 3 90 0 

40 

GGATTTAAAC ACTTAACACC AAATACGAAT CACTATCGTA CAGTAATGCC AGGATTTAAT 3 960 

TATGAAGCAC CACCTACTCA GCACAAAATA AATCCGTATG ATATTACAGG TGCAGAGGTG 4 020 

TTGAAATATA TCGATTTTAA CGCAGGTAAT ATTGCTAAAC AATTATTGAA TCAGTTTGAA 4 08 0 

45 

GGATTTAGCC CTTTAATTAC GAATGAAATC GTTAGTCGTC GTCAATTTAT GACTTCATCA 414 0 

ACATTACCAG AAG CATTTG A CGAAGTAATG GCAGAAACCA AGTTAC CAC C TACTCCTATT 4 200 

SO TTTCATAAAA ATCATGAAAC AGGTAAAGAG GATTTCTATT TTATAAAGTT AAATCAATTT 4 26 0 

AATGATGATA CAGTTACATA CGATTCATTA AATGATTTGC TTGATCGTTT TTATGATGCG 4 320 

CGTGGCGAAC GTGAACGCGT TAAACAACGT GCGAATGATT TAGTTCGATT TGTTCAACAG 4 3 80 
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ATAAAGATAC TGAACAGTTA TATGGTGAAT TGATCACTGC TAATATATAT CGAATTAAGC 4 50 0 

AAGG CGATAA AGAAGTGACG GCATTGAATT ATTATACGAA TGAAGAAGTT GTCATTCCTT 4 56 0 

TAAATCCTAC AAAATCCCCA TCAGCAAATG CTCAATATTA TTATAAACAA TATAAyCGTA 4 62 0 

TGAAAACGAG AGAmCGTGAA TTACAACATC AAATTCAATT GACGAAAGAC AATATAGATT 4 68 0 

ATTTTTCAAC AATCGAACAA CAATTACATC ATATTTCTGT CCATGACATT GATGAAATTA 4 74 0 

GAGATGAATT AGCAGAACAA GGCTTTATGA AACAGCGTAA AAATCAAACT AAGAAAAAGA 480 0 

AAGCGCAGAT TCAATTACAA CATTATGTAT CAACTGATGG CGACGATATA TATGTTGGTA 4860 

AGAATAACAA GCAAAATGAT TATTTAACAA ATAAAAAAGC TAAAAAAACT CACACATGGT 4 920 

tACACACAAA AG AT ATT C CT GGTTCACATG TCGTTATATT TAATGATGCA CCAAGTGATA 4 98 0 

CGACAATCAA GGAAGCGGCT ATGTTAGCAG GATACTTTTC AAAAGCTGGT AATTCTGGAC 504 0 

AAATACCTGT TGATTATACA TTAATTAAAA ATGTGCATAA ACCATCaGGT GCAAAGCCTG 5100 

GGTTTGTAAC ATATGACAAT CAAAAAACTT TGTATGC 5137 
(2) INFORMATION FOR SEQ ID NO: 218: 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2267 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 218: 

GTTTTATCGC AG CAGTAAAG CTATCAATCG GCGGTTCAAT TGATGATGCA TT AG CAG AAA 60 

TCAnACAATC ATTTTAG TT A AAATTTACTA ATAATGAaAA ATGTAAACCT TTTTCAAATG 12 0 

AAACTTTATa AaAAATATGA TAGTATATAT GTAAATGTTT AATAAAATCT GGAGAAATAG 180 

GAGGACATTG CCATGCAACA CCTTATAAAA AAACATGTAT TGAATGGCGA GTTTGATTTA 24 0 

GTACGACAAT TGATGTCCGA AACAGATTTT ATGGAATTTG AAGAAGCATA TATTTCAAGT 3 00 

GCGCATGAAG TAGAAAGTAT GATGTTTTAT ACATGTATTT TAGATATGAT TAAGTACGAA 360 

GAATCATCTG AAATGCATGA CTTAGCATTT TTATTGCTTG TGTATCCACT AAGTGAATAT 420 

GAAGGTG CTT TGGATTCTGC TTATTATCAT GCAGACGCTT CCATAAAACT TACTGACGGC 4 80 

AAAGAAGTTA AAAGTTTGTT ACAAATGTTA TTATTGCATG CGATACCAAC AC CTGTTATT 540 

TCAGATAAGA AGGCTTTTGA TATCGCCAAG CAAATTTTAA AATTAGATCC TAATAATAAT 6 00 

GTTGCTCGTA ACGTCTTAAA AGACACTGCC AAACGTATGc gACAaCGTTG TTGTTGATAT 660 
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AGTTTTAACA 


TTTGGTTGGG 


TTGGGCATAT GTTCCAGCCT 


TTTTTAATAC 


TTAAAAACTA 


780 




ACGAAgTATA 


CTTGTGTGCA 


CAAATGGTTT TTATA CAACA 


TTTTATAAAT 


TTATACATTT 


840 


5 


TAATAAAGAA 


CATACGATAG 


ATGGTTTAAA CCTTGTTAAC 


TGAGAAATTT 


TGATATGTAT 


900 




TCTTCGAAAT 


TTAACTAAAT 


ATACGAAATT CAAGAAGCAC 


AATAATTAAT 


CATTTTTCCT 


960 


10 


ATACAAAAGT 


TCGTATGACT 


GCATTATAAA AG CATAAATT 


TATAATTTTT 


TTAAATGTCA 


1020 




TTGAACGTGA 


TAATGTGAAT 


GGATTGAGCA ATTTTGAAAA 


AGTGAAAAAT 


AACCTATGCG 


1080 




ACTTGCAATT 


AATTTTCAGT 


ACGTTATAAT GCACACTGTG 


CAAAATTAAG 


GAGGTCTATT 


1140 


,5 


ATTCACATGA 


TGATGAa TAA 


AGAAGCAACA AAAATTGGAT 


TTGCCTACGT 


CGGCATTGTA 


1200 




GTGGGCGCAG 


gATTTTCAAC 


TGGACAAGAA GTTATGCAAT 


TTTTCACTAA 


ATATGG CTTG 


1260 




TGGGCTTATT 


TAGGTGTTAT 


TATATCTGGT TTTATTTTAG 


CTTTTATTGG 


GCGCCAAGTA 


1320 


20 


GCAAAAATTG 


GTACTGCCTT 


TGAAGCGACA AATCATGAAT 


CAACATTACA 


ATACGTATTC 


1380 




GGTGAAAAGT 


TTAGTAAAGT 


CTTTGaTTAT ATTTTAATCT 


TCTTCTTATT 


TGGTATAGCT 


1440 




GTAACCATGC 


tAGCTGGTGC 


AGGCG CAACA TTTGAAGAAA 


GTTATAACAT 


ACCTACATGG 


1500 


CTAGGTGCTT 


TaATTATGa C 


ATTAGCGATT TATATTACGT 


TGCkATTAGA 


CTTTAATAAA 


1560 




ATAGTACGTG 


CACTAGGTAT 


CGTTACACCA TTTTTAATTG 


TTTTAGTTGT 


ATTAATCGCT 


1620 


30 


GGCGTTTATT 


tATTTAAAGG 


TCATGtTTCA TTAGCAGAAG 


TTAAC CAAGT 


AGTGCCtGAA 


1680 




GCAAGTATTT 


GGAAGGGAAT 


CTGGTTTGGT ACAATATATG 


GTGGATTAGC 


TTTTTCTGTA 


1740 




GGTTTT AG TA 


CCATCGTAGC 


AATCnGTGGG GATACTGAAA 


AGCGTACAGT 


GTCAGGTGCA 


1800 


35 


GGCGCGATGT 


ATGGTGGTAT 


TATCTATACT GTATTACTAG 


CATTGATCAA 


CTTTGcATTG 


1860 




CAAGTGaATA 


TCCAACTATT 


AAAAATGCCT CAATTCCTAC 


ATTGACGTTA GCAAATAATA 


1920 




TCCAXCCTTT AATAGCAACA GTGkTATCTG TTATTATGCT GGCGGkTATG 


TATAATACTA 


1980 


40 


TTCTAGGACT 


AATGTATTCA 


TTTGCAGCAC GTTTTACAGA ACCATACAGT 


AAAAATTATC 


2040 




ATATCTTTAT 


TATTATAATG 


ATGGTAGCAG GTTATTTATT 


AAGTTnCGTA 


GGATTTGCTG 


2100 


45 


AATTAATTAA 


TAAGTTATAT 


ACnATTTATG GGATATGTAG 


GCTTATTnTA 


TTGTAGTAGC 


2160 




TGTAATTATn 


AAATATTTCC 


AAACGTAAAA ATGGCGGATA AAAAACATAT 


TGCTTTAATA 


2220 




TCATATGGAG 


GGGATATCCG 


AAACTTTACA ATTTGAATCA 


CTTTGGT 




2267 


50 


(2) INFORMATION FOR SEQ ID NO: 219: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 6336 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 219: 

GTCAATGTAA CCTAATAGTT TATGTCTATC TTGTGTACCA ACTACTACAT CGACACCAGG 60 

AATTTCCATA ATTTCAGCTG ATGAAGTTTG CGCATAACAA CCTGTTACAC AGATTACAGC 12 0 

ATCAGGATTT TGTCTTATTG CACGTCTAAT TATTTGACGA CTTTTTTTAT CACCCGTATT 18 0 

CGTTACT GT A CAAGTATTAA TAACAAATAC ATCAGCATTC GCTTCAAAGT CAACGCGCTC 24 0 

ATAGTTTGCT TCTTTAAATA ATTGCCAGAT TGCTTCAGTT TCATAATGGT TTACTTTACA 300 

AC CTAATGTG TGaACG CAAC TGTTGACATA AATATTCACC CCATTAATTC TTTTTCATAA 3 60 

CTTATTGCAC TTAACGCATA CAATGGCGCA GTTTCTGCCC GTAAAATTCT CGGCCCAAGA 4 20 

CCAACAACTG TACTAGTATT ACTAAATAAT GAAATTTCAT TTTCTGACAA ACCACCCTCA 480 

GGaCCAAAAA TCATCAA CAC TTTATCCTGA GCATTGAATT GTTGTAAAGT TTGCTTGAAA 54 0 

TTGCTTAACT CACCATCTTT TGCTTCCTCT TCATATG CAA TAAGAATATA G TCATAATT A 6 00 

TCAATAGTAT CACAAATTAA TTTTAAATTC GACTCGAATT GAATAGATGG AATCACTAAA 6 60 

CGATAGCTTT GTTCAGCAGC TTCTTTAATT ATTTTTTGCC AACGCTCTAT CTTTTTGG CA 720 

ACTTTTGCCT CGTTTAATTT AACAATTGAA CGTTCCATGC TCACAGCTAT AAATGATGAA 780 

GCACCCAATT CAGTAGCTTT TTGTAGCAAC CACTCATATT TGTCAGCTTT GATTAGTCCA 84 0 

CTGCAAATCG TAACATCAAC TGGCAATTCT GTATTAATAT TTTGTTTTTC TTTTAAATCA 90 0 

ACTTCAATTT TATCACTTGT TATGT CAGCA ATTTCACATA AATAAACTGT TTG AT CATTA 96 0 

AAAGTTAAAA TAATTTTACT ACCAACATCA TATCTCATTA CATTTGTTAT ATGATGAATA 1020 

TCTTCTTTTT TTGTAATAAA AAAACGCTGA CTTACAT CAG CGTTTTGGnT CTATGAAATA 1080 

ACGTTGCACA TTATTCACTC ACTTTCTGGC CAACAAGACA AACCCAACCG TTGTCATGTT 1140 

GTTCTGAAAT AATTTTAAAA CCTACACGCT CCATATGTGA CTGTATACCT TCATACTTCT 1200 

CTTTTATAAT ACCAGAAGTA ATAAAATAAC CGCCTTCATT TAGAGTATTA TAAGCATCTT 126 0 

CAATCATTTC ATCAATAATA TGCGCTAAAA TATTTGCTAT TACAATATCA AATTTTTCTG 13 20 

TTTCGTCTTT CAATAAGTTA CCTGGAACAG CTTCAATTAA CGTTTCACAA TGATTTCTTC 1380 

TGAAGTTTTC TTTAGCTACA CTCACTGCCA TTTCATCAAT ATCCAACGCT TTAATACGTT 144 0 

TTACACCGAT TAGATGACTT GCAATACTTA ATATACCTGA GCCAGTACCA ACATCAATTA 1500 

CTGAATGCTG TGGCAATACA TATGTTTCTA TTGCCTTCAA ACACATACTT GTAGTCGGAT 1560 

GATCACCTGT TCCAAAAGCC ATACCTGGGT CGAGCTCAAT GCAAAGCTCT TCATCCGCTT 162 0 
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GGAAATAGTT TTTCCATTCA TTTTCCCAAT CCGTCTCTGC AATAATTTGC TCACTGAATT 174 0 

GAACGTTATG TTGATCAAGT T CATC TAAAT TTAATAACTC ATCTTTAATT TGCTGTCGCA 1800 

ACTTATCATC ATAAGTCATT TCATTAAAAT AGGCTTTCAA TCTTACTCCC TTATCTGGAT i860 

AATCCTCTTT TTTCAAAGCG TAAATTTCAC CGTATTTATC TTCTGGTTGG TTAATTAAAT 1920 

CATCTGAATC TTCTATCACG ACACCATTTG ATCCATGATT TTCAAGTATA TTGGTAGCCA 1980 

ATTCTACTG C TTCATGATTA ATAATAATTG AAAGCTCTGT C CAGTT CAT A CTTTATTCTC 2 040 

CCTTAAAGAA TCTTTTTGCT CTATCTTTAA AATTCGAAGG TTGTTCATTA ATTTCTTCAC 2100 

CATTTAATTG GGCAAATTCT TTCATTAGTT CTTTTTGTCT AT CTGTTAAT TTAGTAGGCG 2160 

TTACTACTTT AATATCAACA TATAAATCTC CGTATCCATA GCCATGAACA TTTTTTATAC 2220 

CCTTTTCTTT TAAGCGGAAT TGCTTACCTG TTTGTGTACC AGCAGGGATT GTTAACATAA 2280 

CTTCATTATT TAATGTTGGT ATTTTTATTT CATCGCCTAA AGCTGCTTGT GGGAAGCTAA 2340 

CATTTAATTT GTAATAAATA TCATCACCAT CACGTTTAAA TGTTT CAGAT GGTTTAACTC 24 00 

TAAATACTAC GTATAAATCA CCAGCAGGTC CTCCATTCAC GCCTGGAGAG CCTTCACCAG 24 60 

CTAATCTAAT TTGTTGTTCA TTGTCGACAC CTTCAGGTAC TTTCACTTCT AATTTAACTG 252 0 

TTTTATTTTC AGTACCTTTT CCGTGACATG TTGGACAAGC TTCTT CAAAT TCTTGACCAC 25 8 0 

TTCCATTACA TTTAGGACAA ACTTGTTCAG TACGAACTCT ACCTAAAATT GTGTTTTGTT 264 0 

CTACAGCTAC ATGACCAGCG CCATTACAGT AACTACAAGT CTTTTTACTT GTTCCAGGCT 27 0 0 

TTGCACCATC ACCATGACAT GTTTCG CATG TTACATCTTT ACGGATTGAA ATTTCTTTTG 2 76 0 

TTGTACCAAA TACCGCTTCT TCAAATGTTA ATGTCATTGT ATACTGAAGA TCATCACCTT 2820 

TTTGCGGTGC ATTTGGATCT CTTTGTCTGC CGCCACCGAA GAAAGAGCTA AAGATATCTT 288 0 

CAAA5CCGCC GCCACCGAAG CCACTAAAAC CGCCAAAGTC AGAGCCATTG AATCCTTGTC 294 0 

CACCAAAACC TTGTGGACCA TCATGTCCAA ATTGATCATA GcTTGCGCGT TTATTATCAT 300 0 

CACTTAAAAC TTCATAGGCT TCAGAAATTT CTTTAAACTT TTCATCTGCA CCTTCTTCTT 3 06 0 

TGTTAATATC TGGATGATAT TTTTTCGAAA GCTTTCGATA COCTTT T TTG ATTTCATCTT 3120 

TTGAAGCATC CTTACTAATG CCTAAAACTT CATAATAATC TCTTTTGGCC ACAGCTATCT 318 0 

CTCCTTTTCT TAATTAACTC ATATAGTTTA ACGTAATATG TCATACTATC CAAATAAAAA 324 0 

GCCAAAGCCA ATGTTCTATT GACTTTGACT TTTCAGATCA TGACAACATT CTAATTGTAT 3300 

TGTTTAATTA TTTTTTGTCG TCGTCTTTTA CTTCTTTAAA TTCAGCATCT TCTACAGTAC 3360 

TATCATTGTT TTGACCAGCA TTAGCACCTT GTGCTTGTTG TTGCTGTTGA GCCGCTTGCT 3420 
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TATCTTCTAT ATCTTGACCT TCTAAAGCAG TTTTAAGAGC GTCTTTTTTC TCTTCAGCAG 3 54 0 

ATTTTTTATC TTCTTCACCG ATATTTTCGC CTAAATCAGT TAAAGTTTTT TCAACTTGGA 3600 

5 

ATACTAGACT GTCAGCTTCG TTTCTTAAGT CTACTTCTTC ACGACGTTTT TTATCTGCTT 3 660 

CAGCGTTAAC TTCAGCATCT TTTACCATAC GGTCGATTTC TTCGTCTGAT AATGAAGAAC 372 0 

w TTGATTGAAT TGTAATTCTT TGTTCTTTAT TTGTACCTAA GTCTTTTGCA GTTACATTTA 3 780 

CAATACCGTT TTTATCGATA TCAAACGTTA CTTCAATTTG AGGTTTACCA CGTTCAGCTG 384 0 

GTGGAATATC AGTCAATTGG AATCTACCAA GTGTTTTATT ATCCGCAGCC ATTGGACGTT 3900 

,s CACCTTGTAA TACGTGTACA TCTACTGATG GTTGATTATC TACTGCTGTT GAATAGATTT 3 96 0 

GAGATTTAGA TGTAGGAATC GTAG TGTT AC GTTCAATTAA CGTATTCATA CGTCCACCTA 4 02 0 

AAATTTCAAT ACCTAAAGAT AGTGGTGTTA CGTCTAATAA TACTACGTCT TTAACGTCAC 4080 

20 CTGTGATAAC GCCACCTTGG ATTGCAGCTC CCATTGCCAC TACTTCGTCC GGGTTTACTC 414 0 

CTTTGTTAGG CTCTTTACCG ATTTCTTTTT TGACAGCTTC TTGTACTGCT GGAATACGAG 4200 

TTGATCCACC AACTAAGATA ACTTCATCGA TATCTGAGTT TGTTAAGCCA GCGTCTTTCA 426 0 

25 

TTGCTTGGCG TGTAGGTTCC ATTGTTCTTC TAATTAATGA ATCTGATAAT TCTTCAAATT 432 0 

T AGAACG AG T TAAGTTTACT TCTAAGTGTA ATGGACCGTT TTCACCAGCT GAGATAAATG 4380 

30 GTAATGAGAT TTGAGTTTGT GATACACCTG ATAAGTCTTT TTTAGCTTTT TCAGCAGCAT 444 0 

CTTTCAAACG TTGTAATGCC ATTTTATCTT GAGATAAGTC TACGCCATTT TCTTTTTTGA 4500 

ATTCTG CAAC TAGGTAGTCA ATAATTACTT GGTCAAAATC ATCACCGCCA AGTTTGTTGT 4 56 0 

35 CACCGGCTGT TGATAGTACT TCGAATACAC CGTCACCTAA TTCTAGGATA GATACGTCAA 4 620 

ATGTACCGCC ACCTAAGTCA AAAACAAGAA CTTTTTCATC TTTATCAGTT TTGTCTAAAC 468 0 

CATATGCTAA TGCTGCAGCT GTTGGTTCAT TAATGATACG CTCAACTTCT AAACCAGCAA 474 0 

TTTTACCAGC ATCTTTAGTT GCTTGACGTT CAGCATCGTT AAAGTATGCA GGTACTGTAA 4 800 

TTACAGCTTT GTCAACTTTC TCAC CTAAaA TAgTTTCAGC TGTATTTTTT AAGTTTTGTA 4 860 

4S AAATCATAGC TGAGATTTCT TGTGGTGTGT ATGATTTACC TTCAATATCT ACTTTATAAT 4 920 

CAGTACCCAT ATGACGTTTA ATAGATTGAA CAGTGTTTGG GTTTGTAATA GCTTGACGTT 4 980 

TTGCTACTTC aCCAACTTGA GTTTCTCCAT TTTTGAAAGC TACAACAGAT GGTGTTGTAC 504 0 

50 GTGAACcTTC AGGGTTTTGA ATTACTTTTG GCTCATCGCC TTCTAATAcT GTnACACATG 5100 

AATTTGTTGT ACCTAAGTCT ATACCAATAA TTTTACTCAT AATAAAATTC CTCCATTTAA 5160 

TCATTAAATT AATTTAATTT TAAACAATGT CTTTTCGCCA AATTTAAGTT ATTGGTTTAC 5220 
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AGTGATTTCG CCAGATTCAA AATCAGGGTT ATCATCTTGA ACTACAGCTT GGTGAATATT 5340 

TGGATCAAAT GCTTCACCTT CAGTTTTAAT AACTTCAAGA CCATTATCTT TTAGTG CGTT 54 00 

AATCAAACTT TCATGC AC CA TTTGTACACC TTTTTGAAGA GATTTAAAAG TCTCATCATC 54 6 0 

ACCTTCAATT TGAAGTGCAC GTTCTATATT GTCTATTGCT GGTAAAATAT CTGTTAACAC 5520 

ACGTTGTGCT TGATATGTTT TGTTTATTTC ATTTTCTTTT TGAATTCTAC GCTTATAATT 5580 

TTCAAACTCA GCGTAGAGCC TTAAATATTT CTCTTCGTTT TCATCTGCTA ATTGTTGAAG 564 0 

TTCATTAATT TTTTGATCTT TTGGATCTAT TTCTTCAATA ACATTCTCGT CAGACGTTTC 5700 

TTCTATTGCT TCATCTTGTA AATGACCTTT ACTTTCTTCA GCTTGTTCAA CTGAATCATC 576 0 

AATATTTTGT TTGACGTTTG TTTCTTCAAC TGTTGATTCA GTGTTTTTTT CAACTGATTC 5B2 0 

GTCTTTATTT GTCATTTTCT GTCCTCCAAT ACTTTCTAAT CCATCATTAC CAAATTCTAT 5880 

TTAATAATTG AATGACATTT TGATAATGCA TAGCTGTAGG TCCAATCACA GCGATTTGAC 5 94 0 

CTTTTAACGT TTCATCAAAA TGATATTGAC TTGTTACAAT TGAAATATCA CTTAAGCTGT 6 000 

CATCAATTTC ATTACCAATT TTTACATTAA TATTTGGTGA AGATATATCT TGTAATAATT 6060 

CTGCAATTCT ATTTGATTCT ATATATTGTA GAATGGGCTG AATTGAAGAT ACATTACTTT 6120 

CATTCAATGC ATCAATAAGT TTAACCTTTC CACCCATATA AATGCTATTA CTTTGATTAG 6180 

AAATATGATT ATTCATCGTA TTTAACAATT TATTGATAAA AATTTCTTCC TGCTCTGATT 6 24 0 

GAaCAAAAGA GACAATATCA TCTTGTAAAT TCTGATTAAA CTCAGTTAGT TTGTTTGTAA 6300 

CAAAATTTGA TATTGTATTT AGTTTGTCAT TATTAA 6 336 
(2) INFORMATION FOR SEQ ID NO: 220: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13059 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY : linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 220: 
TTCATGATTA TTATCTGTTG TAGACACTGC TGGATCTTCC GATGTATCTT TCGATGCATC 60 
TTTCGATTTG TGTATTTGCT GATTCAAATG GTCTAGGTCT TCTAACGCCT TATTTACCAT 120 
TGCTTCATCA TTTTTATCAT CTTTTTCTCC ATGTTTTGTT GTAGCCGTTT GTGACATATC 180 
ATTTTTCATT GCATTAAGAT CGTCCTCGCC ACTTTGTTGA CCCCTATCAA CATTTGAAGA 240 
AACCTCATTT AAATCTTTAA GCAATTGATC TAATTTACTG TCTATATCAC TTTGACCGTT 3 00 
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TTCATCTATT TGCGATGCTG TTTTCGCTTC ATTTAGTTGT GCTTTATAAT GTTCTTTAGA 420 

TGAAGCCGAT AACTGTTTTA ATTGCTCAAT TTGACGAATT GCCTTGTCAA CTTTGTCTAA 4 80 

TAAATCTTGC TTAGATAATA TCTCTTTTGT AATTTCAGTA TCCTTTTCAG ATGCAGCTTG 54 0 

GGCATCGTAC GGCAAGATAT TCGTTAAAAT GATACTTGTC GCCATCATTG TCGAACACGA GOO 

TAACTTTACA TATAATTGAA ACGGTTTCCC TCGATATTTA GCCATCAACA TACTCCTTCC 66 0 

TCACTTACTT CCTTCAAAGA ATTACATACT ATTATATACC TGTTTACAAG AAATTTACAC 720 

TTATCTATCT AGTTATTGTT GTTAGTAATT ATCTACTTAT TACTTAGCTT ATATTTAAGT 780 

AAACAAAACA AGCATGACGT AATATCATAT TGTCCATGTC GCTAACATCA TATTACGTCA 84 0 

AATCTTTTAT ATTAAATGAT GTTTTATTTT AGACTGCTTT TTCCTTTTAG CTTTCGAGCG 90 0 

CCTGTTTAAA AACTTGCTCG AATTGTTCAC GCGAGATTTC GTGTG CATGT GCTTTTTGTG 96 0 

CTAATAAAGC ATCTCGAAAC TGTTGTTGAT CTTTCAAACT TTCTAACATT TGTATTAATT 1020 

GGTCTTTACT TTCCATTGTT ATCTCATCAT TATGCTCAAA TAAGTGCTCT GATAATGTTA 1080 

CTTTAGCATG GTGTGCGGTT TGACGATAAC CTAAAATCAA CAACTCATAG TCAAACGCTT 114 0 

GTTCCACCGC ATTTAAAATT TCATTACCCT CATTGATATC AAGATAAATA TCACATAACT 120 0 

GGTATAGTTC ATTTACCCTG TCAATATTAA TAGATGGGTA TAAATGCACA TTAGCATATT 1260 

GATCAAGTTG CATTAGCTTA TCAGACATCT CTGTAATAGC AG CGATGTG n AACTTAAAAT 1320 

CTGGTAAAGt TyCAACCAAT ACCTTGATGT TACGAatTGa TCCgAGTTAG TTAATATTAC 138 0 

AATTTCTTTA GTATATCTAT TACGACTACG ATAGTTATAT AGATATCCGC CTTGTAAAAT 144 0 

ACGAGATT GA ACCTTTGCGT CTGCTATATT GAG CATCGTT TCATATTCGT TTTTATCTGG 150 0 

AATAATAATA TTACAATGTC GTTTCATATC ACCTTTACAC AT CAATTG CA TATTTCCCGG 156 0 

GACATTACCA TTACAGTGTT CTTGCCATAC CAAAACATCA CTACCTTTTG ATGGCAAATT 162 0 

ATATAACACT GAAAATGGTA GGGCTAGTGA GTTAATAACG AAATGATGTT CCGTAATTTC 1680 

AAGTTGCTTG ATAAAAAATA ATGCGAATGC GAGCTTTGAA GGGAAAAAGT AAGACTTCCC 174 0 

TTGCCAATCC AATATGACAT CAGATGTTAC AAAATTTTCA TAAATCACTT CTTTACCTTC 1800 

TGCTGTCATA TATTTCTTCA AGATCGCTTT ACGATTTAAA TCGTAAACAG TTTGTGCAAA 18 6 0 

TTTAATACCA TTCTTAGAAT AATAATCGAC AAATCGGACA CGTTGTTGGT CATCAAACCA 192 0 

TTCGACACGA CTAACAATTC TAGGGCGCTC TCCACTTTGA yAAAATATTT TACCTCGyAG 1980 

ACGTCCCATA TCATTaATTG TAGCCGAATT GTTGTTACCT TTAATTTCCC AAAAAGCTGG 204 0 

TACAGTAACC TGATTAAAAA ATCGTGGTTT CATATTTTCT GTATTATGAT TATCTGCAAA 2100 
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TAAATCTTCT TCCAACTTAC TGGCTTTAAA AGACTCATAT AACTTTCGTG AATGATCGTT 222 0 

AAAG TAATCA AATAATTTAA TCATGTAGCA CCTCTTGaAC TAATGTTTCC CATTTTAAAA 228 0 

TAATATCTTG AGTCATAAAT TGCTGTGCCA CTTCATAAGA GATGTCATGT GGTGTCTGGG 2 34 0 

GACCATTGTT AAAATACATT ACAATGGcAT GAGCTAGTTT TGCGATAACA TCATCCACAC 24 00 

TATCTTCGTC GGTATCAAAA GGTACCAAGT AGCCATTTTC CCCATCTCGA ATAAAGGTTG 24 60 

GGTTAC CAT A ATTCACATTT AATCCAATCA TACCTAGTCC TGAGCCTACC GCTTCCATTA 252 0 

GTGTTAACCC AAAACCTTCG CTAGTTGATG CAGAAAGAAA TAACTCATAA TCATTATAAA 2580 

TTTCATCAAG TTTAACATGC CCTAGTAAAC GAATATAATC TTGTGCGCGG TGTGTATCAA 264 0 

TAATTTTACG CAGTCGCGTC TTCTCGCTAC CTTCTCCATA AATATCAAAT GTTAATTCTG 27 00 

GCACTTGTCG TTTAGCCACG ATAACCGCTT TGACAAGCCA ATCAATATGT TTCTCATTCG 2760 

CTAAACGAGA TGCACTAATC ATCGCATATG GCTTTCTTGA TAATGTTGGA TATGATAATG 2 82 0 

CATCAATGCT TCCCACAGGA ATAGTATAAA CACGTGGGCG ATAACCTTGA TATTGCTCAA 2 880 

ATTGTCGACA AACCATATGA TTTTGAATAT CTGTTGCTGT AATAAAGAAA TCAATGTATT 294 0 

TAGCTTTTGA AAATTGATAT TCATAATAAT TGTTCCATAG TATATGCTGC TCACTCATCA 3 0 00 

TATTATTACT ATAATG AT CA GCATGAATCA CAACACCAAC TTTACTATCA CCTTTATGCT 306 0 

GCAAAACAGC CTGACCAATA TCAGAAGCGC GGTCTAATAT GACAATATCG TCTCGGGTTA 3120 

AATTCAATCG TTGTAAAAAG TATG CAATAA ATTCCGTTTT GTTATACAAC ACCGCATCTT 3180 

CAAACACATA TATAGAGCTG TCTCCATCAA TATATTCGTT ATAAGCGATG GAACCATCTT 324 0 

GATTATAAAA TTGTCGCATA TATAATTTCG CTTTATTATC AGCTGGTGCA TAATACTCAG 3 300 

AAAATAT GCG CGTATAACTA TAAAAATCTT TACGTACTAA CATACTATTA ATTACAAATT 3 360 

CTGCACGATC CACAATATCT TTTTGTTCAT TTTGCAGATA ACATGTTACA AATGATGATT 34 20 

TCCCATTAAA ATATAGGCGG ACTATCTTAC CATTTCTTTC TCTAAAACTA ATGTCATGAC 34 80 

CAAGCTCACG TTCAATGTCA TCTAACGTGT ACGTTGTTGG TGCTAAAGAA ATATCACTAA 3 54 0 

AATACTGATA CAACCAAATA ACTTCTTGAT CTTTAAACCC AATGTTTTGC GTTAATGTCT 3 60 0 

GTATGTTCTC TGACTGTATA AAATCTAAAA ACACAAATTT AGTGTCTTGA TTTGTACGTC 3 660 

TCAATAATTT AGCACGGTAA GCTTGTGCAT ATTCAACACC GCTACTCGCC CAGCCTATAC 3 72 0 

CAAAGTTTAT ATTATATATT GTCATGCGCT ACCCCTTTTC ATTTATGGAA AATGTATAAC 3 780 

TGGCATACCC TCTTTATCAA ATGTAATCAT GCTTTGACAA ATATTTTTCA CCATTCTTTT 3 840 

TTTGATATTT CGTGTCATAA CTTCAAATGA ATCTAAGGCA ACTCTATGGT ATTCAAAAAT 3 900 
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GACTTGTTCT AACCAACATG AATCAATTGC TTTCAAAAAG ACTTTTTGAA CGAAAATATT 4 02 0 

ATAATAATAT GCACTTTGCA TGTTTTTACG ATTCAAAGCT AATTGCTTTT CAAATTGCTC 4 080 

TAATAAAAAT GTCACTACTG CTTGCTTATC TTTAAAATTA ACACAAGCCA CATCTTTATT 414 0 

AAATTGGAAA CTTAAATTTT GATAAATATA CTCGACAACA CGCGATTTTG TTAG CACCTT 4 20 0 

TTCCTCATTT ACAAACATTT CAAATACATC TTTAGCTAAC GCTTTAAAAT CTTGATTCTC 4 26 0 

AGCATCATCT ATTTCTAAAA CTCGATTGCG TTCCTCGTAT ACAAGATCTC GCTGTATACT 4 3 20 

AATGCTTTTT TCAAATTCAT TAGCCATTTC ACGAGCTTTA ACCCCTTGTT CTTCCGAGAt 4380 

aCGcTGCGCT TTAACTACAA TTTGCTTAAC TTTGCGATTA AACAAATTAC TTTGCGATAA 444 0 

TCGTTGTGCA TCTAATGAAT ATAATTGATT ATTTTCCGCT AAA TT ACT AT CGCTCCATCG 4 500 

CTTAACTAAA TAATCATCTA GTGAAATATA TATACAAGAT GATCCCGGAT CCCCTTGTCT 4 56 0 

ACCAGAACGA CCACGTAATT GCCTGTCTAC ACGGCTATTT TCCATATGTT CATGAATAAT 4 620 

AACAGCTAAT CCACCTAATG CTTCGACACC TTCACCAAGT TTAATATCTG TGCCTCGACC 4680 

TGCCATACTA GTCGCAACAG TCATGGAACC AATTTGCCCT GCTTCAGCTA TCATCTGCGC 4 74 0 

TTCTTTTGCA ACATTTTGCG CAATGAGTAA ATTATTAGGA ATATCCATTT GGAATAATAC 4 80 0 

TTTCGAAAAG TATTCAGCCG CTTCAGCAGT TCTCGTTATG AGTAAAACCG GTCGCCCCGT 4 86 0 

TTCATGAAGT TCAACTATAT CATGAATCAT CGCGATGTTT TTCTCATCAA CTGAACGAAA 4 92 0 

CACTTTATCT GGTTCATCGA TACGTTGAAT CGCTTTATCA GTTGGTACTT GTACGACTAT 4 980 

TTTTGAATAC AAATCAAAGA ACTCTGATTC GCCTAATTTT CCTGTAGCTG TCATACCTGA 504 0 

AAATGATTCA AAAAGTTTAA ATAAATTCTG GAAGGTAATT GTTGCCATAA CACTTTTATC 5100 

TGTTGAAACC TCCATACCTT CTTTCGCTTC AATAGCTTGG TGAAGTCCAG CTTGCAACTT 5160 

AGTTCCCGGT AACATACGAC CTGTAATACG GTCAATTAAA ACAATATCAC CATTATATAC 522 0 

AAAGTAATCG ACATTAGATT CAAACAAATA TTGTGCGCGC AGTGCTAAAT TAATATTACG 5280 

CACTAGGACC ATCGCTTGTT CGCTATATAA ATCTTCAACA TTAAAGTATG ATTGTGCCGC 534 0 

TTCAATACCT TGATTTAACA GCCATATTTC TTTTTTGGTC TTCTTCATTT TAAAATGCAC 54 00 

GTCTTCAATC AATGTATCTA CAAACTCTTT CACAATATGA AATAGATTTG ATTGTAATCT 54 60 

TGGTGCACCC GAAATAACTA ATGGTGTTTG AGCAG CATCT AAAATGATTG AATCCACTTC 5 52 0 

ATCAATAATA CCGTAATTTA ATTGTGGTAA AAATTTCCCT TCCGCACTAT CAGCCAAATT 5580 

ATCAATTAAA TAATCAAAAC CGAGACGTCC ATTAGTTGTA TATATAATAT CATGTTCATA 564 0 

TATATTACGT TTTTCCCCTT TTTGATACTC ATAATCCACA ATATCAACAA AACCTAATGA 5700 
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TAATCATTCG TTGTAATTAA ATATGTTCCT TTTCCCGAAA GAGCATTTAA ATATAAAGGC 5 82 0 

ATCGTTGCCG TTAATGTTTT ACCTTCGCCT GTTTGCATCT CCGCAATGTT ACCTTCATGC 58 8 0 

5 AATACAATCG CTCCGATTAA CTGAACTTCT TTAGGATACA TACCTAATAC TCTCCAGCTC 594 0 

GCTTCACGTG CCACTGCATA AGCTTCAGGT AACAATGTAT CTAGTGTATC AACTCCTGAT 6000 

GCTAAACGTT CTTTAAATTC TATTGT CTTT TGTTTTAACG CATCATCAGA ATATGATTTA 60 6 0 

10 

ACTTCATCG C TCCATGTATT GaTGsGTTcA CTATTTTTCT AATCGACTTT AGTCTTAATT 612 0 

CGTTTATCGT AACATCTAGT TTATGTTTCA TTTACTTCCC CACCATTCAG TTTCGATACA 6180 

JS TCTAAGTAAT CTAAAAATCG TACTGGATTC ATTAAACGTG ACATATAATT TAGATGTTTG 624 0 

TCTTGCTCTT CTTTAAAATA AACCTCGACA TTTGTATCTT TTAGTTCATG ATTTCCTGGG 63 0 0 

ACATGTTCTG TAAGCCATCC TTTTAAATCA TCATCTTCAT GGCTTGTACG ATACACTTTG 6360 

20 CAACCCAAAT GCTGAGCGAC ATAAGTTGCA AAAACATTTG ACTTTGACCC ATAACTAATC 64 2 0 

AAATTAATAG CCTTTAGGGT ATCTTGACTT TGCAAATCAT TCTTTAGTTG CTTAATATTT 64 80 

CCCTCGATAT TGTCGTCCAT CCAACGTTCA ACGAGCCAAA CATGACCAAA CAGTTTCAAA 654 0 

25 AAATCATTCG AAATAGTTGG ATAGGTGTCA GATGGTTCTG CAATAATGAC ATTGATCATA 660 0 

TCATTT C CAT ATTGGTCATC GCCTATCTTC GTCACCCGCA TG CTTTTAT A CTCTAAATCA 6660 

TATTGATGCG TCATCTCTGT GATTG TTAAA CATCTAAATA TAAGACTCGT CGATGCTGCA 672 0 

30 

TTCATCATTT TTATTTTATA AGCATAGGCk TCATCAGGAT ATTGAATCGT AATACTATTT 6780 

GACTTTACAA TCTCAGTACT TAGTTTTGTG CCATTTTTAT TATAAAAAAT GATGATAAAA 6840 

35 TACACTGAAC CAGCAGGCGT TGCATCAAAA TCAAAATGCA ATTTATAATG CTGTCCTCTA 6 900 

CGCAAAATTG GkAAACTTGG CGcACTTTTA TATTTTGAAA ATTGCTTTAA CATCAACCAC 6 960 

TCATGAATCG GTAATCCAGA GGGCATCAAA GGATTTATAA AAGTCACTTC ACCATTTGAA 702 0 

40 AATGATACTT TAGAGCCATA CATAAATGTA GTTTGTGAAA TATAATTCCA AGTAACTTTA 7080 

AATGTTTTGT TTTTCAGCAT GTTGAACTCT CCCAAACTTG TCTTCCAAAA TAATGTTGTA 714 0 

AAAATTAACA AACCAACTTG CAATGGTAGG TGAATCATCA TTATGTCGCC CAGGAATACT 7200 

45 GCGATTCATC ACTCTTGCTT GGTGTGCTGT CAATACAGGT AATAGCTCTT GAAATG CATG 7 260 

TGGAT CATAA TCATCATGTT GCATATATGC TATGGCAAAA ACAGTTTGTG ACAATGATTy 7 320 

CTTTTGAAAT GTTTGCCAAA ATTTTTGATT TAATGCCTGT ATCGACGCTT GAGATGTATC 7 3 80 

so 

ACCTTCATTA GACAC CAGGA CGTCTAATGC TGTACCGAAC TCTTCTGGTC TAAGTAATCG 744 0 

CATATGTTCA GCAATCGTTC CAATATTAAC AAGTGGTTTA CCAACAATAA TTGCCTGAGG 7500 
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TAATTCATGT GATTTAAAAT TCAGCTTTTC TAATGTCTCG TCAATAACAT TGATAATACC 76 2 0 

TTGTT CAT AT TCAGATGAAC CGATATAAAA ACTACCACCT TCAACACGAG GATCGCCGAT 76 8 0 

5 AAGTAAAAAC GGTGCATTCA TACGTTTCAT CATATAATAT CCTTCGAAAC CTTCCGCTGT 774 0 

TCGATAACCA CTAAAATATA CGTTTAGTGG CGGTTTCATA TCACCAGGGT GGAAATAATA 7 800 

AATAAATTCC TGTCGTTGAC TATCTACGAA ACGACTACCA CCAAGTAAAA ATTGACCCAT 786 0 

to 

GTCTAATCTA GACCATCGTT TGTGTATAGG TCCTAAATGT ACCGTCCCGT TCCCACGCGC 7 92 0 

CTTAACAGTT ACACTTATAT AAGCATCAAA TGGTTTCGCA GGTATCTCTA AAGGACTGTC 7980 

)S TAACATATCA TCAGTCAATA CGATTTGTTC AATTAATGCA CCATCAGCGC CAGTCTGAAT 804 0 

CAATCTAAAT GTATATTGCA ACTCGACCGC ACCATCAATA TCAAATTCTG GCCATATTTG 8100 

AATGACTTTA TCTTTATCGT AAACGAGATT ATTTTGCCAA GATGCGATAG GTTTAAATTC 816 0 

20 TTTCCCAAAT TCTCCACTCA ATGTGAGCTC TGAATTACCT TGGTAAACGA CATCTCCTTT 822 0 

AAAATT CGG A TGCACAAGTG CTAACTTAGG AGAAACCTTA TCTCCATACT GTCCTGAGAA 828 0 

GCTAACTGCC T CT AATTT AT TATTACGTTC TTCAATATTC CGGTAATGTA ATGGTTGAAC 8340 

25 AACGTATTTT TGGACATTTT CGTCTTGTTC ATATTCAACT GACCAAAATG ATTCATCAAC 84 00 

ATACGTATTG TATGGTT CGC TTATCATTTG TAATAAATTC GTTAATGTCT CCGAGTATGG 84 6 0 

TGCTTGAATA TAGATAAAAT CAAAGCGCCC TTCTGCTTCA ACAATCGCTT CAATAGCCTC 8520 

30 

TACATAACCA CTATCAAATT CAAACAATCC AATATCGAAG TAATCCCAAC TCACACCTTT 8580 

TTTGTGTTGA AAAATAGGTT CTAAATCGTC TCCTCCAATT TGCAAAACTC TAAATTTACG 864 0 

3S TGG CATCATT TTCACCTTCT ATTAACTCAT CGAGCTGATT AATAATATTC TTAGAAGCAT 870 0 

ATGCATCTAT TAATTTTAAA GAATAGGCGT ACGCATAATT CCAATTTTTC AAATAAAATA 8760 

AATA7ATAATT TAACG CATCA TCTAATTCAT CAACTGTATT TATAATACGG CCATTGTCAT 88 20 

40 AATCAGAGAC GTAATCTGTT TGTTGACCAT TAATTTGTGG AATCC CAGCG CTAATTGCAC 8880 

TAATTTGTAA ATACAAGTCA GGTTCTTTTG ACATATCTAT CACAAGTCGC AACGTCCGCA 894 0 

ATGCTTCTAC AACATCATGT TCAGCATGTA TCGTCTTAAC AG CAATG ATG T CATCTTG AT 900 0 

45 

CTTCAGGTGT CATTAATGCT GAAACATTAA CATCCGCATT CTGTTTAGCT TGGTATTCCT 906 0 

CATTTACCGA CGTAATACAT TCACGAAGCC ACATCGGTAT GTCATTTTGA TGGCG CGATA 9120 

ATAAAATTAA ACGGTAATAA TCTTCCTGTG CGATATAATC CACAAGTCGT TGCATCATTT 9180 

50 

GTTGCAAATC AGCGTCACTC ATACCATCTA TCCATACACC TATAAATGTT TCCATCAATT 924 0 

GACTACTTAT ATTAGGTGAT TGTCTCGTTT CAAATGGTGT GATTCGAATC ATTGTATTCT 930 0 
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TTAAATGGGC ATTCTTTACG ATAGATTGAT ATTCCTCATC TGACACAGTT TCATTTCTAT 94 20 

TTTTAAAAAA TGAATAACTT AATGATTTCG CTGGAATATG ATTGGCTATT TGTCGATTGT 94 80 

GCCTAGCATC TGAAGCCACA ATCACATGAT CATCTTCATG TATTTGTTGT GCAATCATTG 954 0 

CTTGAAATTT TTCTTCAATT AGTTGAGCCA TATTGTTATA TTCTGTTTGT TGATAGTGAT 96 00 

GTTGATATCT TTTTGAAACA GTGACTCTGC CATTTTTCAA ATCTTCATGA AGTACACAAT 96 6 0 

CTCCATTAAT CGTTAAATAT TCTTGGTAAG AAGCCTCTCC CTGATCATCA AAATAACGTA 9720 

TCGCTGATAA ATAACCTCTG TCATCAAAAA TATAACGCCG TTGTAACTGA TCTCTTTCAA 97 8 0 

ATTCTTCAAA CCAAATTGAA TACCCTTCTT GACTAAAATA AATATTTGTA TAGGTCTGTT 9840 

CACTCGTCAC ACATTTTAAT AAATACGGTG TGTACACAAA CTCAACATCA TCCGGCCATT 9 900 

TTAAGTGATG ATAATTAATC GCTTGTGGCG CATGGTGACT GAATCCTTGA ATTTCATCAA 9 9 60 

ACACAGACGA ATACTTTGTC TCATATAAGT CATATCGATG TAAAAATGTT CTTAAATTTG 10 020 

GTGCATGATT GAGAACAATC AGTTGATAAT CTAAGTCATT TTCAAGGTGC ATTCCCATTA 10 080 

AACTAATCAT ATCGTCAAAT TCCGTCTTAT TTTGTAGTTG ATAATACGGC ACAGTCGTGT 1014 0 

CTTGCCACCA TCGTTGGTCA TCGTACCAAG CTGGAATAAA GTATTTCATA ATTACCTCCT 102 00 

TACCAATACT GGTTTAAAAA TGGCTTATAT TTATCAAAAT ATAAATATGT ACGAATTGTT 10260 

TCTGCAATAT TAATACTGAT GTAAACTAAT ACAATCAGTT GTACTGAGaA ATAAATTTCA 10320 

GTAGATAAAT GCGGTACAAA CAATGTGAAA TAAAGCGGTA TACCAATAAT GACTGTAACT 10380 

AATGCCAATC CAAACCAACA TACGCGTCGT GCTTGATAAT TTAAATAACG TTCTGTATCC 10440 

TTACCAGGTT TaACTCCTGA AAAATAATTG CCACTCTTTA AGAAATCTTT GGATTTTTGT 10500 

TTAGTATTGA TTAAAAATCT CGATAAAAAA TAACC CAATA ACATTTGAAT CACTAAATAT 10560 

ACTGAAATAC CTACTGGACT ATCAAATGTC AG CATTGGCA TGTCATCTGA TATGCTTTTA 10620 

TTAAACATAG ATAAAATAAA ATGAATGCCA CTTTTTAAGA AAACAAAAGC TGAAATACTC 10680 

ATCATTAAAG TAATACTGCC TGCAGGGTTA ACTTTCCAAG ATAAATAAGA TTTCATATTT 1074 0 

GTTGCGGAAA CGTTCATTAA ATCGATATAT GGTATTCTCA CTTCTACTAA TTCAATAAAT 10800 

AATAAGATAA ACAATGTGAT TATCACAAGG ATGATTAACA ACG CAATCAC AATATGACTT 10860 

GCATCTATAT ATTCCATTTT TTGATGCATC ATTGATTTAA TAATACTAAC CATTACAATC 10 920 

GGCATTGGTC CTGCGATGCC GTAGCGACTA TTTTTGTCAG CTAACCAAAC TAATAACATC 10980 

GTTCCAGTAA CCAAAATCAA TATTGTTAAG TAAATATTGT CTTGATGAAC ACGTTCTTTC 1104 0 

GAAACATATT CATGAATCAC AAAATAACTT TGAATAACAC TTAAAATTAA TGTTAAGATG 11100 
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GAAATCAGCA TCAAGATAAT CATTGATGTT AACCACGGAC CTAAtCCTAA AGTGAAAATG 1122 0 

TTTAAAGTAT TAACGTCTCC ACCCATATTA GAAATAGCTA TTTTAAAAAA TGACTCATGT 112 80 

£ TTTACTTGCA TATCGTTaTA GGAAACGATG GAAATGTTTG TGCCTAATAT ATAAATAaAC 11340 

AAGATAAAAC ATGTGTATAG CATACGTTTA TATATAATTT TATATTCGTA TTGTTGTAAA 114 0 0 

AGTTTTAACA TGTTG CACCT CTTTTATATC AAAAACATTA AAAAGACTAA GGGTTCATCA 114 60 

CTAATTATTA AAATCCTATA TCGATTTTTC TAGTGATTGG TGCCTCAGTC TTTTTAATTT 11520 

TAGCCAGCTA TAAATTCAAT TTATGCTTGA GAATCATCTT GATCATTTTC ATCTTTCTTT 11S80 

TTCTTTCTCT TCATTAAACC TAAACCAACT AATAATGTCA TAACGCCACC TAGTAATCCA 11640 

15 

TTTTGTTTTA TTGAGTCACC TGTATCTGGC AATCTTTTTT CACTTTGTGC TGGTGTGCCA 11700 

TTATGTTTAG TCACTTCAGA TGTTGCACTT AATGTAGACT GAGATTCACT CGTGCTCGTT 11760 

20 GTTGCTTCAC TTGATAAGCG AGATGTGCTC GTGCTGTGAG TATGATGCAT ACTCATTGAG 11820 

TCTGACGGAT GCATTGAGTT AGATTCAGAT GTACTTGTTG AGCCGGACAT ACTTGTTGAT 11880 

GTTGAGTCAG AAATGCTTTG TGAACCAGAC ATAGATGTAC TCAGTGATTC GGATGTGCTT 11940 

25 GTCGAATCGG ATGTGCTCAA TGACGTTGAT GTGCTTGTTG ACACTGATTC TGAGTCACTA 12000 

ATTGATGTTG AGTCGGATTT GTCTTGTGAC ATTGAAACAC T CGATG AATT AGATTCACTC 1206 0 

ATTGATGTTG AGTCAGATAC GCTCGTTGAA CCTGAACCAG ACGTACTTAA TGATTCAGAT 12120 

ATGCTTGTTG AAGTTGAACC ACTTGTTGAG TCCGATGTAC TTGTCGATGT CGAGTCTGAA 12180 

TCTGATGTAC TCAATGATTC TGAGTCACTG ATAGAAGTTG AATCACTTGT AGATTCTGAT 12240 

3s TCTACTGTAC TTTGTGAACC ACTGATACTT ATTGAAGTAG AATCACTGAT ACTGTCTGAT 123 00 

GTTGATAATG ATGTCGACAC CGATGTGCTT TGTGATGACG ATGTACTAGC ACTCATTGAC 12360 

ATTGATGTTG ATATCGATGT ACTTAAGGAA CCAGATGCAC TTGTACTTGT TGACTGGCTT 1242 0 

40 TGTGACATTG AATCACTTAA TGATGTAGAT GTGCTTGTTG AGCTCGAGTC ACTTACACTT 12480 

GTTGAACCTG ATATTGAGTC ACTTAAACTT GTCGATGTTG AAACTGAtwC GcTTCCGCTC 12540 

ATTGAGTCAG ATGTTGAAAG TGATGTACTC GTTGAATTTG ATCCACTGAT GCTAGACGAA 12 600 

45 TCACTTGTAG ACATTGAGTC GCTTTCTGAT GCACTGATGC TCATAGAGTC AAATTGACTA 12 660 

TTACTTGTTG AGCTTGACTG CGAATCGCTC ACACTTGTTG ACGTTGATTC TGATCCACTC 12 720 

ATACTTTGCG AGCTACTCAA TGATTTTGAA TCACTTAATG AATCCGAAGT GCTAAGACTT 12780 

SO 

GTGGAACCAC TTAAAGATAT TGATCCACTT AATGAGTCGG AGTCACTTGT ACTAGTAGAA 1284 0 

TCACTCATTG ATATTGAATC ACTTAG c GAG GTAGACTyGc tTACGCTTTC TGAACCACTT 12 90 0 
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TTTGAATCAC TTAATGAATC AGATTCACTC ACGCTTTCTG AACTTCTTAG TGACGTCGAT 13 020 

ACACTTAATG ATGACGAATC GCTTGTGCTT ACTGAATCG 13 059 
5 (2) INFORMATION FOR SEQ ID NO: 221: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10758 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

1S (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 221: 

AGGGATGGCC TTACCTAAAA AACCGGGnAA ACCCTCCAAA ACCCATTAAA AGGnTGGnTA 6 0 

CCCTTTAAAA TGGTAGCATT TAACCGCCAC CCGCCAAGGT GGGTGGTTTA TTCTTCCGTT 120 

20 ATTTAAATTA GTACACCATG CAGATT CTGT AGTTGAGGGA TATTTTAACG AAAGCTTATT 180 

AGCAACTGAT AAAAAAATAC GTCCTAAGGC ATATATTGCT TCATGGAAGG ACATCGAGCC 24 0 

GGCTAAGAAA ATAGAATTTA AAATTAAAAA AGGTATTAAA TGG CATGATG GTAATGAATT 3 00 

25 GAAAATTGAT GATTGGATTT ATTCAATTGA AGTCTTAGCT AACAAGGACT ACGAAGGTGC 360 

TTATTATCCA AGTGTAGAAA ATATCCAAGG TGCGAAAGAT TATCATGAAG GAAAAACTGA 42 0 

TCATATTAGC GGATTGAAGA AAATAGATGA CTACACTATG CAGGTTACAT TTGATAAAAA 4 80 

30 

ACAAGAAAAT TACTTAACAG GATTTATTAC TGGACCTTTA TTAAGTAAAA AATATTTATC 54 0 

AGATGTACCA ATTAAAGATT TAG CG AAATC AGATAAAATC CGAAAATATC CTATTGGTAT 600 

35 TGGACCGTAT AAAGTTAAGA AAATCGTTCC AGGTGAGGCT GTTCAACTCG TTAAATTTGA 66 0 

TGATTATTGG CAAGGTAAGC CTG CACT AG A CAAAATCAAT TTAAAAGTTA TTGATCAAGC 72 0 

G CAAATT ATT AAGG CAATGG AAAAAGGCGA TATTGATGTT GCGAATGATG CTACCGGTGC 78 0 

40 AATGGCAAAA GATGCTAAGT CATCTAATGC TGGTCTCAAG GTATTATCTG CGCCAAGCTT 84 0 

AGACTACGGT TTAATAGGtT CGTATCTCAT GATTACGATA AAAAAGCTAA TAAAACTGGT 900 

AAAGTGAGAC CAAAATATGA AGACAAAGAA TTACGTAAAG CAATGCTTTA TGCAATTGAT 96 0 

45 AGAGAAaAAT GGATCAAAGC GTTTTTCAAT GGTTACGCTA GTGAAATCaA TAGTTTTGTA 102 0 

CCATCTATGC ATTGGATAGC AGCCAATCCT AAGGACCTAA ATGATTACAA ATATGATCCT 108 0 

GAAAAAGCTA AAAAAATCTT AGATAAGTTA GGTTATAAAG ATAGAGATGG TGACGGATTT 114 0 

50 

AG AG AAG AT C CTAAAGGTAA TAAATTTGAG ATTAACTTTA AACATAATTC AGGTTCTAAT 120 0 

CCTACTTTTG AACCAAGAAC TGCTGCGATA AAAGATTTCT GGGAAAAAGT TGGCTTGAAA 1260 
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AATACGATTC CTGTTTATAT GCCATATATC ACATCTTATT TCATGACGCG TGCTATCGGC 1380 

GACAGACCTT TAGTCGTCCC GCATCAATCT CAGAACTTAG CATTTATTGG TAACTTTGCA 144 0 

5 GAAACAGAGC GAG ACACTG T ATTTACAACA GAATATT CGG TTCGTACTGC CATGGAAGCT 1500 

GTTTATCAAT TACTAAATAT AGATCGTGGT ATTCCAGAAG TCATCAATAG TC CATTTG AT 1560 

CTTCGCGTCT TAATGGATGC CATATACGAA CTGAATGACC ACCAAGATTT GCGTGAGATT 1620 

10 

ACTAAAGATT CGAAAATGCA AAAACTCGCA TTAGCAGGAT TCCTTAAAAA GATAAAAGGT 1680 

ACGTACATTG AGTCATTATT AAAAGAACAC AAATTGTTAT AACGAAAACC ATTAATAGAT 174 0 

TTTTATTTGG TGATTTCAAA TCATGAGACT GGGACAGAAA TGATGTTTTC ATAAAAATTA 1800 

15 

TTTCGTTGTT CCACTCTCAT GATTTTTTTG ATGAAACATA ATTACATGAT TGATTGCATC 18 60 

ATTTTGTTAA ACAAGTGATT GCAAACCTGC CATTTCACAC TGAAAATTTA CATAATAAGT 1920 

2 o GACGATATTT TACAAGTCAT ATACAAATAA CATATATTGT TAAATAATTT TACCTAATCT 1980 

TAACATTAAA TTTACAATTA TAAGCGATAA TCTAAATATA AAGCTTATTT GAGGTGAAAT 2 04 0 

AATGGAAATG TCGGTTACAG AAGTCATTTT CTCCTTTTTA GGTGGTTTAG GTATTTTCCT 2100 

25 TTACGGCTTA AAAATCATGG GAGACGGGCT TCAAGCATCA GCAGGAGACA GGCTACGAGA 2160 

TATTTTAAAC AAATTTACAT CAAATCCAGT ATTAGGTGTT ATTGCAGGTA TCGTTGTAAC 2220 

TATTTTAATA CAAAGTAGTT CAGGTACGAC AGTTATCACA ATCGGACTGG TAACAGCTGG 2280 

30 

ATTTATGACA TTGAAACAAG CCATTGGAGT GATAATGGGT GCTAATATCG GAACAACGGT 234 0 

AACTGCATTT ATTATCGGTA TAGATTTAGG CGAATATGCA ATGCCAATTT TAGCATTAGG 24 00 

TGCATTCTTA ATCTTTTTCT TTAAACGCTC TAAAATCAAT AACATTGGCC GCATACTATT 24 6 0 

35 

CGGTTTCGGT TCACTATTCT TCGGTCTAGA ATTTATGGGT GATGCCGTTA AACCTTTAGC 252 0 

ATCATTAGAT GGATTTAAGC AATTAATGCT TGATATGTCT ACAAATCCAA TACTCGCTGT 258 0 

40 CATTGTCGGC GCAGGGTTAA CAGCACTAGT TCAAAGTTCA AGTGCGACGA TTGGTATTTT 264 0 

ACAAGAATTT TATCAACAAG ATTTAATTAG CTTAAACGCA GCAATCCCTG TGTTACTAGG 270 0 

CGATAACATT GGTACCACGA TTACAGCTAT CTTAGCTAGT TTAGCC GGCT CAATCGCTGC 276 0 

45 AAAACGTGCG GCGCTTGTAC ACGT CATCTT TAACTTAATC GGGG TAATT A TCTTCACAAT 282 0 

TTTCTTGCCA GTTGTGATTC ATTTGATTAG TTTGTTACAA G ATTTATGG C ACTTAAAACC 2880 

AG CGATG ACG ATTGCAGTAT CACATGGTAT CTTCAACATA ACAAATACTT TGATTCAATT 294 0 

SO 

ACCATTTGTA GCAGGTTTAG CATGGATTGT TACAAAGCTT GTCCCAGGTA AAGATATTG C 3000 

TGATGACTAT AAACCTCAGC ACTTAAACAA AGATCTTGTT TATCACGCAC CTGGTGTTGC 3060 
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AGACATTCGC GAAATTACAA AAGACGATAA AAAATTGATC AAAAAGCTTG AACAAAAGCA 3180 

TCAAGCTGTT GAAACAATCA ATGATAGCAT TCGAAATTAT TTAGTTAGAA TTTCTACAAA 324 0 

AGCCATTACG AAGGCAGACG TTGAGCGTTT AGCAGTTATG TTTGATGTCA ATCGCTCTAT 33 0 0 

TTTAAAAGTA GCAGAGCTAA CAGAAGAGTA TGTCGCTCAA TTAAAACGCC AACATGATGA 336 0 

AGATATTCGC ATTACAGAAG ATG CACAACG CGGTATGGAT AAATTATTCA ACCATGTTGC 34 2 0 

TGAGTCATTT GATAAAG CCA TCGACATGTT AGATGTTTAT GACAAAACGA AAAAAGATGA 34 8 0 

AATTGTAGAA CGTAGTAGAG AATCATTTAA TATTGAACAT AAACTACGCA AAGGTCATAT 3 54 0 

TAAACGCCTT AATCGTGGTG AATGTACAAC AAAAGGCGGA TTACTATATA TCGATATGAT 360 0 

TGGTGTTCTT GAACGTATCG GTTATCATTC ACGAAATGTT T CTGAAGCAC TTGTTGG CCT 36 6 0 

TAACGATGAT GTAC CTACAG ATGAAGAAAT TGCAACAACT GAAATTTAAT TTTTACTGTC 3 72 0 

TTATTTATAT TCATATTTTT TTAAAATTAG AGATTCAGAT GCATGTAAAA AGCCAATCCA 378 0 

ACATTCATGG GTTGGCTTTT TTGTTTAGCA AAATTTATTA TCTTAAATCG GCTATAAACA 384 0 

CTGATATAAT AATGCTTCAT TAGTATGCGG TAAGCATGAC GGACACTGTT CTCGGAGTCT 3900 

GACCCCGAAA CGTTTAATAT ACACTTTTAC ACGTCGCCTT CATTGAAGCG AATTGCCATA 3 960 

ACCTTCACAT TATATATAGT TCTTTCCATA TAAATGT CCA AATTTTTAGA ACAACG CAAT 4 020 

AAATAACCAT CCACCTAACT TATCAAAAAT TTAAGTGGAT GGTTTTT CAT TTT CATTTAT 4 0 80 

ATTTATATTA GTGTTAATCC AATCATAGAT TTATCTATAT GCACTGCTCT ATACATTTCC 414 0 

TCATTTAATT TGCTTTACTT TCATTTATAT CATTATCAAA ACACTTGGCG TGTCATCGTT 4200 

ATTATTTCGC ATCTTTGACA CGTTTATCAT CATTAGGAAT CGCGAATAAA ATTGCGATAA 42 60 

ATGCCATGAT TCCCATTAAT ACGTTAACCC AAAGTGCAAT CATCGCACCT GTATGAATGC 4 320 

TCGTTGCAGC AACTGCACCA G CAT ATACAG CACCACTAAT TGCGACACCG AATGCGCCAC 4 3 80 

CAAGTGATGA AGCCATTTTA TAAATACCTG AAGCAACGCC AACTTTATCT AACGGTGCAT 4 44 0 

TCGAAATAGC TGTATCTGTA GAAGGTGTTG CATAAATACC TAAGCCTAGT CCGAAACATA 4 50 0 

AATATCCTAC GACACAACTG ATAACATAAA ATATGCCTGG TAAGAATACT AATGAAATAA 4 560 

GTGCAATACC AATGACCACA ATGAATGTAC CTAATAACAT TGGTCGCTTA GAACCCATTT 4 6 20 

TTTGTAATAA TTTTTCACCA ACTCGAATCA TCAATAACAC CATGATTAAA TAAGTAATTG 4 680 

ATAAGTATCC TGCCTGCAAT GCTGTATAAC CTAAACCTTG TTGCACGAAT GTATTCGCTA 4 74 0 

CAATTAATGT AC CTG CAAAA CCGTTTAATA AGAAGTTCGA AATCGTTGCA CCTGTATATG 4 8 00 

GTTTATTTTC AAATAATTTA AAATCAATAA GTGGATTATC TACTTTTTTC TCAACATTTA 4 860 
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AACCAAGTGC TGCACCTTTA GTAATGACAA CGTTTAAACT TAG CAACATA ACTACTAGAA 4 980 

CAATTAGCCC TGCAACGTCA AATTTATGTG TATTGGTAAT TTCTGATTTC GTTTCAGGCG 504 0 

5 TCCCTTTGAT GAGTAACATT GAAAGTACGG CAACGATAAT TGAGAAGATG AAAATCCATC 510 0 

TCCAACCCAT AGTTGTCGCA ACTGCACCAC CGAAGAGTGA ACAGATACCA CTGCCACCCC 516 0 

AAGAAC CGAT AGACCAATAA CTTAAGGCAC GCTGACGTTC AGCACCCTGA TAATAAG TTT 52 2 0 

to 

TCATAATGGC CAATGTAGAA GGCATAATAC ACGCTG CTG A TACACCTTGT ATAACACGAC 52 8 0 

CTAAAATTAA TAATGCCGGT AAATT CGTAA TAATAATTAA TGCTGAACCA ATAATACTTA 53 4 0 

JS ATAATAAACC GATATTCGTC ATTTTCACGC GCCCAATTTT ATCTGCCAGA CCACCTGCTC 54 0 0 

CAACAACAAA CATGCCTGAA AATAGTGCAG TTAGACTGAC CGCAATACTA ATTGTCCCCA 54 6 0 

TGTCTGTACC AAAACTTTGT TGTAAATTCG GTACAACATT TACAAGTGAT TGTGCAAACA 55 2 0 

20 ACCAAAATGT AATAACACCT AATACAATAC CTAAGATTAA CTTGTTGCCC CCGCGATACG 55 8 0 

TTTCATTCAT GTTAGTTATC TCCTTTAAGG TAAT CTAAAA CAACTGTCCC TACTGCTT CT 564 0 

GCAGAAATAA GTAATGATTT TTCTGAAATG TT AAA TTT AG GATGATGATG TGGGTAAATT 5700 

25 TCACCATTTT CCACCGCTGC ACCTGTATAA ATAAAGGCAC TTGGGCGTTC TTTAGCATAA 576 0 

TATG CAAAGT CTTCTGAAGG TGGTTGTGGT TCACACATTT CAACACCAAA ATCAAGGTTT 582 0 

GCTTCTTTCA ACGTCTTAGC CACGTACTCA GTAAACTCTG GATCATTATA TAATGCTGGA 58 8 0 

30 

TAATCATCGT TATATTCTAA GGTGCAAGTt ACACCATACA TATCCTCTAA TCCTTTTGAT 594 0 

AAACGTTTAA TTTCTTTTTC AATTGTTGCT TTTGTAGCAT CTGTTAATCC ACGTACATCA 600 0 

35 CCTTCAATTT CAACAACATC TTTAATGACA TTGAATTGAC CTTTACCGTC AAATGAACCG 6 06 0 

ATTGTGACAA CACCGGTTTC AAATGGACTT AGTCGTCTAG ATACAACTGT TTGTAACGCT 612 0 

GTGACGAAGT AGCTAC CTG C AACAATGGCA TCATTGGCCA TATGTGGTGA TGAACCATGA 6180 

40 CCACCTTTAC CTTGAACTTT CAATTTGAAG AATGCGCGTC CTGTTTGAAC ATAACCAGGT 624 0 

CTGTAATACA CTTTACCTGT TTTCATTGTG CTCATGACGT GTACACCTAA TACATGATCA 630 0 

ACACCGT CTA ATACACCATT TTCAAT CATT GTTTTAGCAC CACCTGGTGG TACTTCTTCA 6360 

45 G CTGGTTG AT GTATCACAAC GACTTTTCCT GTAAAACTAT CTTTCATTTC AGCAAGCGTC 6420 

TCTGCTAATA CAAGCATGTA TGCTGTATGT GCATCGTGAC CACATGCGTG CATAACACCT 648 0 

TTATTTTGTG ATGCAAAAGA TAATCCTGTA TCTTCAGTAA TGGGTAATGC GTCAAAGTCT 6 54 0 

SO 

GCACGGATTG CTAATGTTTT ACCAGGTTTC CCTGAATCAA TCGTTACTTT AATT C CACGT 6600 

GGTCCGACAT TCGTTTCTAC TTCCACATCT TTACCTTTGT AAAATTCAGC GATGTATTTC 6 66 0 
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ATCATTTTGC CTTCTTTAGA TTTTAAAGTT TCAATTAATT GTTGATTCAT ATCCTTCATC 678 0 

TCCTTAGTTA CATCATAAAT GATTAATCAT TATTTATATT GCCAACAACA GAGATGTTAA 684 0 

CCATTAATTT TTTGCAATTT TAGCTTTGAA TATAAAAAAT CACAAATTAT GTATATCAAA 690 0 

ATTTGTGATT TGTGATCATT TTATGAACTT GGGTAACGTT TTACTTCAAT TAAGTGAATC 6 96 0 

CCATTCG TAA TCATTTTAAT GTTTAATGCC AGTGTGTCCG TGATATCTAT ATCATATACT 7 02 0 

TCTAATTTCG GAAAACTCAT TCGATTAACG TAATCTATAG AGTCCTTGTC CATGCCATGT 708 0 

ATCGTATGAT GTTTGCGCCA AAGATTAAAT AACGCACCAT TTTCTTTATC TAAGGTAAAA 714 0 

TGTTTAATCT TATACATACC TTCTTCCAGG GCATTAATGT TCAAATGAAT CATTTCCGTC 72 0 0 

GCACGCATAT TCATTTGATT GTCCAACGCT AAGTACGGAT TAAAATGCTT TGCATCATAT 7260 

AACAATATTT GAAAATTTGA ATCAGTCCCC GTGACAATAC ATGTATCATC AGAATACAAA 7320 

ATATTGCTTG TTAATTTATT AAATAGCAAT GCCGTGAAAT AGACCGGACG TTTTCCATTA 73 80 

TATTGATGAA ATAGTTCAAT AGAATTCATA TAATCCCGTT CATTTTTACA ATGACTGACG 744 0 

TGCAAATCAT AATTCAACCA ATACCCGATA CCCTCTACTT TAGAACTTAA TTTTAATAAT 7500 

TGCTCAATGA TGATACCACC TCTAAAATAT TCGCCGTTTG TAATAAATGT ATCACCCGTC 7560 

AATGTATTCC AATTGAGTAA AATGAGTGGA CGCTTTAGGC GATGACGATG CATTAAGTCG 7620 

ATAAGGTAAT TCGTTTTATT AATAATCATT TGACTCGCGG TTTTAAATTC ATCATCATTC 7680 

ATTTTATTAA AATCAACAGC GTCATTTGAA TTGGCATCAA ATACAAAATG GTCGATGTGT 774 0 

GGCTCAAGTC GTTTCAATAA TGGTAGATGT CTTTCCGTAG CTTGATCTAA GTGAATGTAC 7800 

AAGCCAC CAT TAGGGAATAA TGCTTTAAAA TAATCAATCA TTTCAATCAA AGACGTGTGC 7860 

AATGTCGTCA CATACAAGTT GAACTTCAAA TCTTTTCTAT GACTGACATG CAGGGCAACG 7920 

TGATGGATAA AAATTTTAAA TGCATCGATA TAATCACGTG AGTCATACTG ATCCAAATGC 7980 

ATGGTCAAAC TAAAGTTATG AT CTAAT AAA AAGTCTAAAC ACAAATCAAT ATCATAAAAT 8040 

ATATTCGAAA TTTCTGCATC ATACGTGAAT GGCGCATTGA GCTTTTTCAT GATATATGGA 8100 

ATCACATCAT ATGCTAATAC TTCATTGACT TGAAAATCAT GATGACATGT AAGCAACTGT 8160 

GATTGATACT GTGTATTGAG CAAATTCCTC AAATAGCCCA CTTGAATAAT ATGATTAAAT 8220 

TGATTTAGTT GGTGATTGGT TGGTTGAAAG GCAATCTCTT TATAGTTCAT CTTTT CAAT A 8280 

TCTTCAATAA AATGATTCAT TTCTTCAATG TAGTCATTTA AAAGTAATAT CAATTCACGG 8340 

TCGTGATAAT CATGTTGTGC CGATTGCTGG TTTTCAGTGA TTGCTGGACG ATCACCTCGA 8400 

TATTGTTTAG GTGTTTGATG CGTAAAGTGT TTAAATGTTC TCGCAAAGCT CGCTGCACTT 8460 
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TTCGCATGCT CAATTCGCGT CGTATTTAAG AAATGATGGA ATCCTACACC TAGCGATTCT 8 580 

GTAAACTTTT TAGACAGATG GCTCTCTGAC CACCCAACGT ATTCGCTTAA TTCTGAAAGG 8 64 0 

CTTAAATCTT CATGAAAATG TAACTCGATA TAGTCGCATA CTTGATTCAC TTTATCATCA 8700 

TTTAAGATAC TTTGGTTCGA ATGATATGTA CGCGGGACAT AATGAATCAT ATGCATAAGC 8760 

AACTGAATCA CAAGTTGTTG CTCAGTCAAT TTAGACAACT CATTATGTCG GATATGTGTT 8 82 0 

GAAACCAGTC TTG C CATTAT ATTTCTCAGT TGATGTATAT TCTTTGTTGT GGTCGCATCT 8 880 

GTTAAGTGAA AATATAGACA ATGCACATCA TCAAACTTGT CTG CTAAATA TTTCATTTGG 8 94 0 

AATTGGATAT AACATATGAT GCCATCTTGT TGAAGTTGAA ATCGATACAA GTCGCGGTGG 90 00 

TTAATGATGA AAATGTCGCC ACTGTTGCAT TGCGTCATAT TATTTTCATC ATAAATGTGT 90 6 0 

GCCTCnCCTT TAATAACAAA ACCAATCATT AAACTATTGA GCCTTTTGAA ATCTGACATA 9120 

CTCTCAGTTT CTACTCGAAT TAAATAATCA CGTTGCATAC TATCCCTCAA TTCAGTAATA 9180 

TGAATACGTT TATTTTACAT TATTTTACAG CAACATATTT GAATTTCATA TTGAATCGTG 924 0 

TGTGTGGATG ATTATTTATC CTCACTCGGT TCAAGATGTA GACTATCAGT AAAAAAAGTA 93 0 0 

TTTTCACCTT TTTTCTCCAC AAAAGTAAAT TCAATGTCTT TATATCCAAC TGrTGaACCT 93 60 

TTTAAGTCTC CCgAACCTTT CaACaATAAC TTTGGTGCTT TATTCGTTGG TATTTTATAT 94 2 0 

CTTTTTCGTA ATTGTTTTAC ATTATAGTCA TCATTAGTTA ATTGATATTT TGCTGAATAA 94 80 

CTCGGTACCT CTGGATTATA TGATATATCG CCGTCTTTGT ACTTCGACAA ATCTTTAAAG 954 0 

CTGCCATATT GCGCGAAGAA CTTAAAATTC TCGATTTCTT TTTTTATATT TTCGTCTTTG 96 00 

ATACCTTTAG TTGGAATGAT TTTATTGTCT ACCATTTTAA CGGGATATTC TTTATCTTTA 96 60 

CTCTTAGGTC TACCATCTTC AT CATG AAGT GTTTCACTCA CTATATACTT CC CGGTTGT A 972 0 

GTCTTAGTGT TTCTATTCAT ATATAGAACC ATACCTTTTG ATTTCATACG TTCCCCTTTA 97 80 

GGTTGAACAA CCATTTCAGA ACCAATAATC CATGTAC CTT TATCATTTTT ATCAAATTCG 984 0 

TCATCACGAT AACCTTCTTT ATCG TAT AAA TCCTCTAGAT TTTTAATCGG ATACATACTC 9900 

AATGTTTTTT CAAAGCTTTT CTTAACTTCC GCTTCTTTAC CTATGCCACA ACCAGCAGTG 996 0 

AAACTAATGA CTAATATCAA AAAACTAATA TACAATACCA ATTTGTTTAA TCGTTTCATA 10 020 

ATTT CACAAT CCTATTCTTC TTATTATCTT TCCTGGATTG ATTTCATATT TTGATCGAGT 10 080 

CATGATTATT TATCCTCACT TGGTTTAAAA ATTAACCCAT CACTAAAGTA AATGTTCTCT 1014 0 

TCTTTTTTCT CTACAAACGT AAATTCAATG TCTTTATATC CAACTGATGA ACCTTTTAAA 102 00 

TTCCCTGTAC CyTTCAACAA CArCTTCGGy GCTTTATTTG TTGGTATGTC ATATCTTTTA 10260 
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ACCTCTGGAT TATATGATAT ATCTCCATCT TTATAATTCA TTAAATCTTT AAAATTGCTA 10380 

TATTG CG CAA AAAACTTAAA GTTTTCGATT TCTTTTTTTA TGTtTTCTTC TTTAACTTCC 104 40 

TCAGTAGAAA TGAATTTATT ATTAATCATT TTAACTGGAT ATTTTTTTTG ATTATCCTGA 105 00 

GCTACTTCGT ATTTCTCCGT CTTTAtTTCA TTAGTATAGT AAAAtCCTTT TGCACTTCTT 10560 

GTATTTCTAT CTATCTTCAA AAGCATGCCT TTTATTTTTA GAGCTTCTCC TTTATTTTGA 106 20 

ATTG CCATTT GAGAATTTAC AAT C CATGTT CCCTTATCAT TTTTATCAAA TTGATCATCA 10680 

CGATATC CTT CTTTATCGTA TAAATCCTCT AGATTTTTAA TCGGATACAT ACTCAATGTT 10 740 

TTTTCAAAAC TTTTCTTT 10758 



(2) INFORMATION FOR SEQ ID NO: 222: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1109 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 222: 

nTaTCaACTT TGGaATTTAA AgTCAATAAC TTTTTTAAAA ACTTTTTGTG TTCACAACCC 60 

GCTTCTTTTT CAACG CGTTT ATTG CTTAAC ACAAGAACTT ATTTTACCAG CATTCCAAAA 12 0 

CAAATCAACA TAAAAACGTA CAAAATAAAA GTAATTTTGT ACGTTTAGCA TATATTATAC 180 

CTATTTATTT GTAGCAGCTA TAACTTTTTG TGCAATCGAG CTATAAATTT TACCTAGACG 24 0 

ATCATCTGAT TGATATATTG ACGGTGCAAA ATCTTTTGGA TTCCAAGATG GTTGCTCTAA 300 

AGGTAATTCC CCAAGTAATT GAGTATTAAG TTCATCAG CT AACTTAGTAC CGCCACCTTT 360 

GCCAAAGACA TATTCTTTAT TACCCGTCTC TTTACTTTCA AAATAACTCA TGTTTTCAAT 42 0 

TACGCCAAGA ATAGAATGAT CCGTATGTTT TGCCATCGCA CCTGCGCGAg CTGCAACAAA 48 0 

TGCTGCTGTA GGATGAGGTG TCGTTACAAT AATTTCCTTA CTTGAAGGTA ACATCGTATG 54 0 

AACATCTAAA GCTACATCTC CTGTTCCAGG TGGAAGATCG AGTATTAAAT ATTCAATGTC 600 

TCCCCATTTA ACTTCTGTAA AGAAATTCGT CAACATTTTA CCTAACATTG GCCCTCTCCA 660 

TATAACTGGC GCATTTTCTT CCACAAAAAA GGCCATTGAT ATAACTTTAA CGCCATGACG 7 20 

TTCAACTGGA ATTACTTCCT TCCCTTTAAT TCCAGGCTTT TCATCAATAC CCATCATATC 780 

TGGTACACTA AATCCATATA TATCGGCATC TACTAATCCG ACTTTTTTCC CTTCACGAGC 840 

TAAGGCAACG GCTAAATTTA CTGCAACAGT AGATTTACCG ACACCACCTT TACCGGAGGC 900 
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ATTTTCTTCT TTTGGTTTAA ATTGATTTAC TTTTTCTTCC GGCAATGTTT CAAATCGTAT 102 0 

ACCGACCGTT TTCGCACCGT TTTCTTTTAA TGCATTAACA ACAGCCATCT GTAAATCTAA 1080 

aTTGCGtGCA CCACCTAATT GTGCCATTG 1109 
(2) INFORMATION FOR SEQ ID NO: 223: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3997 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 223: 

TCTTTATTTA AAAAAATGAT TGTCTAGTTT GTATCTCTCT GAAGATTTGG CAATAAATAA 60 

AAGCCGATAA CCGTATAATG ATTATCGACT TAAAGTTTAT GTGGCATTTT TTACTTTTGT 120 

AATTTCAGGT GAGTTAGATG ATTATTATCA GATAGATTAT TGCTTATAAT CATATGATGT 180 

TTGAATGATA T CTTTG ATTT CACTGATTAG TGCTTCTTTA GGATTAGCAG TTGTACATTG 24 0 

ATCTTCAAAT GCGAGCTCTG CCATTCTATC AATTGACTCA TTTAATT CTT CTTCAGACAC 300 

ACCTTGTGAT TTCAAATTCA TTTCAATTCC GACTGATTGA CCTAATTCGT AGACAGCTTT 360 

AgCTAATGAT TCTACGAGTG CTTCTGTCGT ATTACCTTTT AATCCTAAGA ATTTGGCAAT 420 

ATCTGCATAA TCTGTATCTG CTCTGAAGAA CTCATATTTA GGGAATAATG CATGTTTTTG 4 80 

CGGGTCTTTG GCATTATAAC GGATAATATG CGGTAGTAAT ATCGCATTCG CTCTACCATG 54 0 

CGGAATACCA TATTCGCCAC CAATTTTATG CGCAATTGAG TGTGCAATGC CTAAGAATGC 600 

ATTTGCAAAT GCCATACCAG C CAAAGTTGA TGCGTTATGC ATTTTCTCTC TTGAAACTTT 660 

ATCACCCTTT TCAACAGATG ATTTTAAATA TTCGAACGTC AATTTAATCG CTTGTAGACT 720 

CAAACCTCTT GTGTAG TCTG AAGCCATTAC AGATACATAT GATTCCATTG CATGCGTTAG 780 

TACATCCATT CCTGTATCTG CTGTAACGCT TTTTGGCACA CTCATCACAA ATTGAGGGTC 84 0 

AATAATTGCA ACGTCAGGTG TTAAAGCAAA ATCAGC CAAC GGATATTTTA CATTTGTTTC 900 

ACTATCTGTG ATAACTGCAA ATGGTGTTAC TT CTGAACCT GTACCTGATG TCGTAGGGAT 960 

ACAAATGAAC GTCGCATTTT CAGGCATGCC TATTTTATAA GTACGTTTAC CGATGTCTAG 1020 

GAACTTTTGT TTAGCACCGA AGAATGATGT CTCAGGGTGT TCAAAGAACA TCCACATTGC 1080 

TTTTGCAGCA TCCATCGCTG AACCACCACC AAGTGCAATG ATTGTATCCG GTTGGAAATC 1140 

AACCATCATT TCCAGACCTT TATATACTGT ATTAGTTGAT GGGTTCGGTT CGACTTCGCT 1200 
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ATAACCGAAT TCTACCATAC CAGGGTCACA GACAATCATC ACTTTTTCAA TCTTGTCCAT 1320 

TGTTGTTAGA CTCATGATTG CATTTTCTTC AAAATAAATT TGAGCAGGCA CCTTGAAAAT 1380 

5 TTGAGTATTA TTACGTCGTT TAGCAATCGT TTTAATGTTT AATAAATCTG TCGCACTAAC 144 0 

ATTATGTGAA ATTGAGTTTC TACCGTAGaA CCACAACCTA ATGTTAAAGA CGGAATCAAT 1500 

TCGTTATACA TAT CACCAAT ACCTCCAACC GCTGATGGTG TATTTACAAG TACACGACAA 1560 

GCTTTCATTC TTAGTCCAAA ATCTTTTTGT AATGTTTCAT CTTCTGTATG GATAACGGCT 1620 

GTGTGTCCTA ATCCACCAAA ATGTAGTGTG TCTTCACAAA TTTGAAATGC TTGTTTTGTA 1680 

IS GATTGGGCTT TTACTAAGGC TAATACTGGA GATAATTTTT CACGAGATAA CGGATAGTCT 174 0 

GAACCTACAC CG CTAATTTC GGCTATGATA AGTTTTGTAT TTTCGGGGAC AGGTATACCT 180 0 

GCTAATTCAG CTATTTCAAC TGCAGATTTA CCGACAATAT CAGGCTTAAT ACCTGTTTTT 1860 

20 TGTTCATTcA TAATTGCATT TTCTAAGCGT TGTAATTCAT CTTTTTTAAC AAAGTATGCT 1920 

TGATGTGCTT TAAATTCATT AGTAACATCT TTATAAATTT CTTTATCAAT GACTACAACT 1980 

TGTTCAGAAG CACAAATCAT ACCATTATCA AATGTTTTTG AACCAATGAT ATCATTTACT 2 04 0 

25 GCACGTTTAA TGTGTGCTGT TTTTTCAATG TAAGACGGCA CGTTACCTGG TCCCACACCT 2100 

AATGCCGGTT TGCCAGTTGA ATATGCAGAC TTAACCATGC CCGAACCACC TGTTGCTAGA 2160 

ACTAATGCAA TACCTTTGTG ATTCATTAAT TGTTTTGTTG CTTCGATAGA AGGCACTTCA 2220 

30 

ATCCACTGAA TAATATCTTT AGGTGCACCT GCCTTCATTG CCGCTTCTAA TACAACTTCT 22 80 

GCTGCACGCT TCGACGATTC TTGTGCACTT GGATGGAATG CAAAAATGAT TGGATTTCCT 2 34 0 

3S GTCTTAATTG CAATCATCGC TTTAAAAATA GTTGTCGACG TAGGATTTGT TGTTGGCGTA 24 00 

ACACCACAAA TAACACCAAT TGGTTCCGCT ACATACGTTA ATCCTTTTTC TTTATCTTCA 24 60 

CCAATAATCC CTACTGTCTT ATTGTCTTTT ATTGAATTCC ATATATATTC AGAAGCGTAT 2520 

40 AAATTTTTAA TCGCTTTATC TTCGTATATA CCTCTTCCAG TTTCTTCATG TGCTAATTTT 2580 

GCTAGCACCA TATGTTGATC AACAGCTGCT AAGCTCaTTT GATGAACAAT ATGATCAATT 2 64 0 

TCTTCTTGTG ACTTTTTAGA TAATGCTTCT AATGCTTTTT TCCCTTTGTC AGCTAGAGCA 2 70 0 

45 TCAATCATAA TTGCCACTTC TTGTTCTTTC GATCCACGAT TTTCTTTTTC AGGTATAGTT 2 76 0 

AACATATACA ACCACTCCTT TATACTTTGT GAATTATTTC ACAAACATTA TAGTACATGT 282 0 

CTCTCAGGAT ATAAAGAAAA TTCTATACAA AAAAGTTTAA TTTCGAATAT TATTTGAACA 288 0 

50 

AATATCAAAT TTTAAAATAA ATGTTTTCAT GAAATCATTG TTATTTCGGT GTTTTTAGAA 294 0 

TGATTTTATA ATCATAATTT TTTCAATGAC ATAATTTATT CAT AATT A T A TATTTAATTC 3 00 0 
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TCCTTGTCGA TACCTATCAA CAGATGTTAC AAATAAAAAC CaCCCGTGTG AACGGGTGGT 3120 

TTGTTCTGCG gCTATAAGCC TTCCTTACTG GCCaGCCCTA AAAGGGCACT GACAAGTCAG 3180 

CCAACTGCAC TACTATTCCA GCAATCCTAA AGGTTTACTC TTTTTTCTTT CTTTTTTTAT 3 24 0 

TTTTCTCTCC AGTGAAAGGA TCTAAATATT CTTCCATTGA AATTTCATCT GCAACGATAT 3 3 00 

CCTCTTGTAA TTGATTACGA ATATAATTTT CAATCACTTT TTTATTT C TA CCTACTGTAT 3 3 60 

CCACATAAAA TCCTTTACAC CAAAACTTTC TATTTCCATA TCTATACTTT AAGTTAGCAT 3 42 0 

GTCTATCAAA TATCATTAAA TTACTTTTCC TTTTAAATAG CCAACAAATG ATGATACCCC 34 8 0 

AAGTTTGGGT GGTATACTTA CTAACATATG GATATGATCT TTACATACCT CTGCTTCAAT 354 0 

TATCTCTACA CCTTTTCTTT CATATAATTG ACGTAATATA ATCCCTATAT CTTTTTTTAT 3600 

TTTTCCATAT ATCGCTTGTC TTCTGTATTT AGGTGCAAAG ACAATATGTT ACTTACAATT 36 60 

CCATTTCGTA TGTGCTAAAC TGTTTGTGTC AGATGACATT AAATAGCATC TCCTCGTGTT 3 72 0 

GATTATTTTG GTTGGCTGAC CAATATTTAC TCTAACATGT AGAGATGCAT TTTTTTGACA 3 78 0 

ATGGTAGAAC CTTTTCTGGG GAGTGGGACA GAAATGATAT TTTCGCAAAA TTTATTTCGC 364 0 

CGTCCCACCC CAACTTGCAT TGTCTGTAGA AATTGGGAAT CCAATTTCTC TTTGTTGGGG 3 900 

CCCCGCCCCA ACTCGCATTG CCTGTAGAAT TTCTTTTCGA AATTCTCTGT GTTGGGGCCC 3 96 0 

CTGACTaGAA TTGAAAAAAG CTTaTTaCAA GCGCATT 3 99 7 
(2) INFORMATION FOR SEQ ID NO: 224: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13 91 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 224: 

GnGCGAGACA AACACACtTA TTGGTGCCAT TATmCcTAGA ATGaATTCaT ATGCAGTAGA 6 0 

TGAa aCAATC AAAGGATTGG CAAAACAATG CCAAAAATAT GAATCaCAAT TAATTTTAAA 120 

TTACACAGGT TTAAATATCG AAGCAGAAAT ACAAGCGCTT GAAACATTAG CACGCaGTAA 180 

AGTAGATGGT ATTGTTTTAA TGGCTACAGA CATAACAGAG AGACATATTG AAGTCATTAA 24 0 

TAAAATGAAT GTACCAATCG TTATTGTTGG TCAACAACAT GAACAACTTC ATAGTATTGT 300 

GCATGATGAT TATAAAGCAG GTCAAATTAT AGGCGAATGG ATTGGTCAAC AGGGATATCA 360 

ACAAGTTGAA GTGTTTAGTG TAAGTGAAAA AGATATTGCA GTTGGTATAC ATAGAAAACG 420 
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TACTTATGTG GAAGCACAAA AAGATGTTGC AAATGTTTTG GAAAATGTGG AGCAAGTAGA 54 0 

TGCGGTTGTT GGAGCAACTG ATACGATTGC ATTAGCTGCC TATAAATATT ATTCTGATAA 60 0 

AAAAGATGTT ATGAAACCAC ATCAAATATA TGGTTTTGGT GGTGACCCAA TGACACAATT 66 0 

AGTGTCTCCA TCGATAAAAA CAATTCATTA TAATTATTTT GAAGCTGGCC AATGCGCGAT 72 0 

GGaAG AGATA CAACAGATGC TTAAAAAGCA AGATATGCCA TATAGCGTCA CAGTAGATGT 78 0 

TAATATTTAG ACGCTGTATT TTTTAAAATA AATGTGGAAC CGATACCATA TAACTATAAA 84 0 

TGGATAGGTT AAAAGTTAAA GAACGTAGGT AAAATTTGCT ATAATAGAAT ATAAATTGTT 90 0 

AACAGCATAA ATTATAAAAG GAGGACTGGG TAAATATTAT GACCGAATGG ACTAGAGAAG 960 

AACGTTATCA ACGAAT CGAG GACGTTGATA CTGAG TATTT TAAAACATTA AAACAACAAG 102 0 

TTGAT CAATC AAAATTTCGT CAACAATTTC ATATACAACC AGAAACAGGC TTATTAAATG 1080 

ACCCCAACGG ACTTATTTTT TATAAAGGGA AGTATTATGT TTCACATCAA TGGTTC CCAT 114 0 

TAGGCGCAGT ACATGGCTTA AAGTATTGGT ATAACTACAC GAGTGATGAC TTAATAAACT 1200 

TTAAAGCTGA AGGGCCAATT TTAAATCCAG ATACTAAATA TGACAGCCAT GGTGTATATA 12 60 

GCGGTAGCGC TTTTGAATAT AACGGG CATT TATATTATAT GTACACAGGA AATCATCGAG 1320 

ATAATCATTG GCAACGACAT GCGAGTACAG ATGATCGCAC GATTGAAAGA AGACGGTTnC 13 80 

AGTTGG nAAA A 13 91 



(2) INFORMATION FOR SEQ ID NO: 225: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 930 base pairs 
3S (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 225: 

ATTTATTTTA ATGTTTATAT TTTCTAACAC TTTTTTATGA TCATAGTAGT AATTGACATT 60 

TTTCAATTCA AAGACTGGTG TCATCGTATC TCACCTCGCA TTCAACTATA CAACTCCTAG 120 

45 TAACATATGT AAACAGTAAT GTTTACGACT CAAAATTAGA CAAAATAAAG AGATATGCCC 180 

CCTTCAAGTT TTATTTATCG CATTTCTTGA AGAGAGCATT ATCATTTTAT TGTTGCATAA 24 0 

CCTTATTTTT TAATTCTGGG TCAAATTGCT GTTGTTTTAA CATTTCAATT TCAAGTTTAT 3 00 

50 

ATGGCGGTTT TTTATTTTTC TTATCTTCAC CAACATAAGG TGTTTCTAAG ATTTTCGGAA 3 60 

TATCTTTAAA ACTATCATGA TGCACAATGT AATTTAATGC ATCAAAACCA ATGTAACCGA 4 20 

55 
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GAACAACTTT GATTCTGTCG ACTCCAATGA TTTTATCAAA TTCATTTAAT ACGCCATCAA 54 0 

AGTCCTCTTT AACATTATAT CCAGCATCAT GCGTATGACA TGTATCAAAA CATACTGATA 6 00 

AACGTTCGTT ATTATGAACT CCATCAATAA TACGTGCTAA CTCTTCAAAT GAGCGACCAA 660 

TCTCTGTACC TTTACCTGCC AT CGTTTCAA GCGCAATACG TACATTATTG TCATTCGTTA 720 

AAACTTCATT TAATCCTTCA ATAATCTTAT TAATTCCGGC ATCAACACCA GCTCCAACAT 78 0 

GCGCACCTGG ATGTAATACa ATATCTTTAG CCCCTATAGC TTGCGTTCTk TCaATTTCTT 84 0 

GTTGCAAGAA ATCTACACCA AGATTAAACG TTTCTGGTTT GGTTGTAttG CAATaTTaAT 900 

GATGTATGGT GGCATGAACA ACAATATTAG 93 0 
(2) INFORMATION FOR SEQ ID NO: 226: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 226: 

TGACGCACCA ATTTATAACG CAATTGACAA AACAATTAGA TATACCTGTG AAATTTGTAC 60 

CTGGAAACCA TGATTTATGG GAAGTTGAAA GTATGACTAC GCAAGACATT TGGAATAATT 12 0 

ATAAGAGTAT GTCACAGTGC TTGGTAGGAA AACCATTTAT AGTAAATGAA GAATGGGCAA 180 

TCATAGGACA TACTGGCTGG TATGATTATA GCTTTGCAGC ACAACGATTT TCATTAGATG 24 0 

AGTTACAAAA AGGAAAACAT TATGGTGCGA CTTGGCAAGA TAAAGAACGA ATATCTTGGG 300 

GCATATCAGA TCAAAATTTA TCTAAAATAG CGGCTGAACA AGTGAAGAAA GATATATTAG 3 60 

AAGTAGGAAA TAGACGAGTG ATTTTAGTCA CACATGTTGT GACGCACCCT GATTTCATTG 4 20 

TTCCTATGCC GCATCGTATA TTCGATTTTT ATAATGCATT TATTGGGACA AGTGATTTCA 4 80 

ATCCTTTGTA TGCGATGTTC GATATACCAT ATAGTATTAT GGGCCATGTT CATTTTCGTA 54 0 

AAAGTG TG AT AGATGATGGC AGATGTTATC TCTGTCCGTG TCTAGGCTAT CCAAGACAAT 600 

GGCGTTCAGA AG ATATTTA C CAGGAAATAA ATGAGACGAT ACAAATAATA GAAATTTAAA 660 

ATGCGCAAAC CTGACCCAGT TTGCGCATTT TATGTTTTAC ACACGCGAGT AATGTGTTTA 720 

CTTACGTGTG TTTATTTTGT TGCTGATTTT CAATTGTATA TGAATGTGGT TGCACATAAA 780 

TGCACTTTCT TCCTGGTGAA TTAAAGCTGT ATTCCATTTT CTCTTTACGA ATTTTAATAA 84 0 

TTTGTTTGCG ATTTGGAATG ATGGCAGGTA AAACTAGGCC ACGACGAATA TGACTCCAAA 900 
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TTGAAACTTG TTTCGCTGGC TTGTTATCAA AGCGGAAAAC ACGTAGTAAT GGTTTAGAAC 1020 

CAAGATTAGT ATGGTATATT AACACAGGTT GACCTTGATC GATAATACCT TTAAGATCTT 1080 

CTAACGATTT ACCAGTGCCG TCTACGATAT TAGGATTGTA TTTTTGTAAA AATGGTACAT 114 0 

ATG CTTCTGG AAATATCGTT TGATGATAAT TGCCAAGCTT AATGAATAAG TGATGTCCAA 1200 

CATAACCTTT ATGTGGATTG TTCGGATGTG TCGGCCAATG TCTCATAATT TCTGTAG CAG 12 60 

GGATATGTTG GTTGTTGTAT TGCAACATCA TGGCTGCGGA AACACCTTCA CACCCCATGA 13 20 

CCATAGGGAT AGGAAATAGC TGACTGATAG GTTTAACTGG TAATATTTTT CGGTTCATAA 1360 

TATAGTCCTC GCATTGATTC AATAAATATT TAATATAATT ATATAGCGTC AATGCAAAAT 144 0 

GTCCTAAACA TATGTTTTAC ATGAGTGAAT AAAATTAATG GAGTGATAAA ATGGAATATC 1500 

AATTACAACA ACTTGCGTCG TTAACGTTAG TAGGTATTAA AGAAA CGT AT GAAAATGGAC 1560 

GACAGGCTCA GCAACATATA GCAGGGTTTT GGCAAAGATG TTATCAAGAG GGAGTAATTG 1620 

CGGATTTACA GTTAAAAAAT AATGGTGATT TAGCCGGGAT ACTTGGCTTA TGTATACCTG 168 0 

AATTAGACGG TAAGATGTCA TATATGATTG CAGTTACCGG AGATAATAGT GCTGATATTG 1740 

AAAAATATGA TGTCATAACA TTAGCAAGTT CAAAGTATAT GGTATTTGAA GCACAGGGCG 1800 

CAGTACCTAA AGCAGTTCAA CAAAAAATGG AAGAGGTTCA TCACTACATA CATCAATATC 186 0 

AAGCAGATAC GGTAAAATCA GCACCATTTT TTGAGTTGTA TCAGGATGGT GATACTACAA 1920 

GTGGAAAATT AATATTACCA GAAATTTGGG ATnCCTGTTA AAGGGGTGAT TGAAATAnGA 1980 

AnTG 1984 

(2) INFORMATION FOR SEQ ID NO: 227: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6373 base pairs 
- (B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 227: 

GATTCCACGT GTGTTAAAAG AAG TTACAc C TTCAATGATG GTATTTACTA ATTTCTTTAG 60 

AGATCAAATG GATCGCTT CG GTGAAATTGA TATTATGGTT AATAACATTG CAGAGACAAT 12 0 

TAGTAATAAA GGCATCAAAT TATTGCTAAA TGCTGATGAT CCATTTGTGA GTCGTTTGAA 180 

AATCGCAAGT GATACGATTG TGTACTATGG TATGAAAGCA CATGCCCATG AATTTGAACA 240 

AAGTACGATG AATGAAAGTA GATATTGTCC AAACTGTGGT CG CTTATTG C AATACGATTA 3 00 
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AAAATATGAA ATATCAAGTT TTGATGTGGC AC CGTTTTTA TATTTAAATA TCAATGATGA 420 

AAAATATGAT ATGAAAATTG CAGGTGACTT TAACGCTTAT AACGCGTTAC AGCATATACT 4 80 

GTTTTAAGAG AGCTAGGGTT AAATGAACAA ACAATTAAAA ATGGCTTTGA AACGTATACA 54 0 

TCAGACAATG GTCGTATGCA GTACTTTAAA AAAGAACGAA AAGAAGCGAT GATCAATTTA 6 00 

GCTAAAAATC CTGCAGGAAT GAATGCAAGT TT AT CAGTTG GTGAACAATT AGAAGGCGAA 660 

AAAGTGTATG TTATTTCG CT AAATGATAAC GCTGCAGATG GTCGAGATAC TTCATGGATT 720 

TATGATGCAG ATTTTGAAAA ATTATCTAAG CAACAAATTG AAGCTAT CAT CGTGACAGGT 780 

ACACGAGCAG AAGAACTTCA ATTGCGATTG AAGTTAGCAG AGGTTGAAGT ACCAATTATA 84 0 

GTTGAGCGTG ATATTTATAA AGCAACGGCA AAGACTATGG ATTATAAAGG TTTCACAGTT 900 

GCAATACCAA ACTATACATC ATTAGCGCCT ATGCTTGAAC AATTAAACCG TTCGTTTGAA 96 0 

GGAGGTCAAT CATAATATG C ATGAATTGAC TATTTATCAT TTTATGTCAG ATAAATTGAA 102 0 

TTTATACAGT GATATAGGAA ATATTATTGC TTTAAGACAA CGTGCTAAAA AACGAAATAT 108 0 

TAAAGTTAAT GTCGTAGAAA TCAATGAAAC AGAAGGTATT ACCTTTGATG AATGTGATAT 114 0 

TTTCTTTATC GGTGGTGGAA GTGATAGAGA ACAAGCATTA GCAACAAAAG AATTAAGTAA 1200 

AATTAAGACA CCACTTAAAG AAGCGATTGA AGATGGTATG CCGGGATTAA CGATTTGTGG 1260 

AGGCTATCAA TTTTTAGGGA AAAAATATAT CACGCCTGAT GGTACAGAAT TAGAAGGG TT 132 0 

AGGTATTTTA GATTTTTATA CTGAATCAAA GACAAACCGA TTAACAGGAG ATATTGTTAT 13 8 0 

CGAAAGTGAT ACTTTTGGAA CTATTGTAGG TTTTGAAAAT CACGGTGGTA GAACATATCA 144 0 

TGATTTCGGT ACACTTGGTC ATGTTACTTT TGGTTATGGT AATAATGATG AAGATAAAAA 150 0 

AGAAGGCATT CATTATAAAA ATTTATTAGG TACTTATTTA CATGGACCAA TTTTACCTAA 1560 

AAATTACGAA ATCACTGATT ATCTGTTAGA AAAAGCTTGT GAACGTAAGG GTATTCCGTT 162 0 

TGAGCCTAAA GAAATAGATA ATGAAGCGGA AATACAAGCG AAACAAG TAT TAATAGACAG 1680 

AGCAAATAGA CAGAAGAAAT CTCGTTAACT CTGAACATCG CATCAATGGA TTTAATATTG 174 0 

ATAAACGATG AAGTTTAGTA ATTAATCATA TATGTATAAA CACACACATT ATTTTGGATG 1800 

GAAACAACCA AATTGATGTG TGTTTTtTTG TTCTAGTGAA TAATTATTAT ACAATGAGTA 1860 

TCTATCCTAG AATTATCAAT AGTAATGGTG ATTATG CAAC ATGAAAAAAT GAATGATGAA 192 0 

AGGAATTTGA CGATGAAGCC TACTAAAGTG ATATTAAAAG ATGCATCTTA TTTACATAGC 1980 

AAAACATCGA TAACATTTAT TTTAAAAGAT GTAGTTATCG AAGAAGATAA TAAAATTTAT 2 04 0 

TATTTCGACA CTAGTGCAcT TTCGAAGATC AAGAAGTTAA ATTTGAATTT GCACTCTTTG 2100 



993 



epuuy /Bba 1 9 itilfi ,'A j ,lirthf)lfiyl J ai>l-'riienil inn iments w>i n if i c Hhi i m rnn 



EP0 786 519 A2 

TTATAGAACC TGATTTACAT TTTACAATTA TTGATTTTAA TCAAGAACTG CTTTGTATTT 2220 

ATATTGATTT TGATTCTGGT TTAAGGCATT CAAACATGGC AACAGAATCT GGTATTTCAT 2280 

5 TAAGGATAAA TGTTGCTAAA TCAGATTTTA CTAAATTTAT TAATGAATTA GCCTCTTTAC 2 34 0 

ATTAATGATT TAAATCTGAT ATG TAATTAC AATCAAAAAA GACAGCCACA TCCCTCCGTA 24 00 

GTTTAGGCGT GTGGCTATAT TTGAGTCTGA ATATTTATGC TTGTAATTTT AAAAAGGGAC 24 6 0 

10 

ATGCTATATA CGATAAAAAG AGGCGGGGAC ATAAATCAAT GTTCTATGCT CTACGAAGTT 252 0 

ATATTGGCAG TAGTTGACTG AACGAAAATG CGCTTGTAAC AAGCTTTTTT CAATTCTAGT 2 580 

CAGGGGCCCC AACAAAGAGA AATTGGATTC CCAATTTCTA CAGACAATGC AAGTTGGGGT 264 0 

15 

GTGGGCCCCA ACACAGAGAA TTTCGAAAAG AAATTCTACA GGCAAAGCGA GTTGGGGTGG 27 0 0 

GACGACGAAA TAAATTTTAT GAAAATATCA TTTCTGTCCC ACTCCCATGG TGCCAATTAG 2 7 60 

20 CATAAGGTAC TTAAATTAAG CATATCTGCT GTCTAGCAGT CGATAAATCA TTAGAACTTC 2820 

GTATAGTATA TGACTTTTAA TTTGATTTTC ACCACTAATT TCAAGTGCTT TTATAGTCGA 2880 

ACGTAAAGTT TCTACAGAAT CATCTTCTCT CTTAAAAGAA CCATCATAAA ATATATCTTT 2 94 0 

25 GATGCTACTA CTAATTT TTA GCAATGCCAT TTTTTCGTCA CCTGAAAAGT TAA CACGAGT 3 00 0 

ATTTTTAGGC AAGTAAATGA TATTTGATAA ATGAGTGATA AACAAACGAT TCGTATATGC 3 06 0 

ACGTTTAGTT AATTGATTGA GTAATTTCCA ATCACATTCT TTTTTCTTAT GATAGCTTAA 312 0 

30 

TTCATCACGT TGATAACTTA TTAACGTTTC AACTTGATTA TTTAAATTGA AAATATTTTT 3180 

ATATGCTTTT TCGCTTTTAT CAGATTGCAG TCTTGATAAG ATAAGTTCTT GGCAGCGATT 324 0 

GTAAAATAAT TTATACATCA AGGCATCTGT CTTACTTAAT TTTTCTTCGA CCTGACCATA 3 3 00 

35 

ATACTTAGGT GGAAACACCA TGAAGTTAAT TAAACCTGAT GTCACGAGTC CAATAATTGC 3 3 60 

TGTCAATGTT CGAGACAAAA AGTTGAATAT GTAGGCATCA TGAATACCTG GAATCATAGC 34 20 

40 TAATGATGTT AGTACAGCGA CATTCGTACC AACTTGCAAT TTGAGTT TTG TACAGAATAA 34 80 

AATCGTGAAC GTTGCACTCA ATGCATATGT AAAAGGTGAT TGATCGCCGA ATAAATATGT 3 54 0 

AAATAATACT GCAAAGCCTG CACCAATTAC CGTAGCAGGT AATCTACGAT AAC CTTTAAT 3600 

45 AAGTGATGCC TTGGCAGTTG GTTCAATTGT GACTACAGCT GTTAAAATGG CATAGATGGG 3 660 

TGTTAAATCT AGTGCCATAC AAAAGACAG C TGTTAAAAAA ATGGCAATAC CAGTTTTAAT 3720 

TGTTCTGGCA CCAATTAAAT GTTTATACCA TTGATCGTTC ATTTTTTAAC CTCTAATCAT 3780 

50 

OGTAAAATCT TAGCGAGCGC TTTATAATAA TAGTAT CGTA CATTGGAAAA GTTCATGTAT 3 84 0 

GTAAAATATT TGAAATAATC ATACATAAGC ATTACTTTGA TTTTCATATA CATTAATCAA 3 900 
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CAAGCATTTT TCAATTATAG TCCGGGGCCC CAACATAGAG AATTTCAAAA AAGAAATTCT 4020 

ACAGG CAATG CAGGTTGGCG GGGCCCCAAC ACAGAAGCTG ACGAAAAGTC AGCTTACgAT 4 080 

5 AATGTGCAGG TTGGCGGGGC CCCAACATAG AGAAATTGGA TCTACAATTT CTACAGGCAA 414 0 

TGCAAGTTGG GGTACAACGA TAAAGAAATA TTTTTT CTTT ATCACACTAT GTCTCACTCA 4 200 

CTTTC CAAAA TACTAAAGTA ACATCTTTAG TATATCAAAG AATTTTTGCT ATAATAAGTT 42 6 0 

ATAATTATAT AAAAAAGGAA CGGGATAAAA TGATTGTAAA AACAGAAGAA GAATTACAAG 43 2 0 

CGTTAAAAGA AATTGGATAC ATATGCGCTA AAGTGCGCAA TACAATGCAA GCTGCAACCA 43 8 0 

1S AACCAGGTAT CACTACGAAA GAGCTTGATA ATATTGCGAA AGAGTTATTT GAAGAATACG 444 0 

GTGCTATTTC TGCGCCAATT CATGATGAAA ATTTTCCTGG TCAAACGTGT ATTAGTGTCA 4 50 0 

ATGAAGAGGT GGCACATGGG ATTCCAAGTA AGCGTGTCAT TCGTGAAGGA GATTTAGTAA 4 56 0 

20 ATATTGATGT ATCGGCTTTG AAGAATGGCT ATTATGCAGA TACAGGCATT TCATTTGTCG 4 62 0 

TTGGAGAATC AGATGATCCA ATGAAACAAA AAGTATGTGA CGTAGCAACG ATGG CATTTG 4 6 80 

AGAATGCAAT TGCAAAAGTA AAACCGGGTA CTAAGTTAAG TAACATTGGT AAAGCGGTGC 4740 

2S ATAATACAGC TAGACAAAAT GATTTGAAAG TCATTAAAAA CTTAACAGGT CATGGTGTTG 4800 

GTTTATCATT ACATGAAGCA CCAGCACATG TACTTAATTA CTTTGATCCA AAAGACAAAA 4 86 0 

CATTATTAAC TGAAGGTATG GTATTAGCTA TTGAACCGTT TATCTCATCA AATGCATCAT 4 92 0 

30 

TTGTTACAGA AGGTAAAAAT GAATGGGCTT TTGAAACGAG CGATAAAAGT TTTGTTGCTC 4 980 

AAATTGAGCA TACGGTTATC GTGACTAAGG ATGGTCCGAT TTTAACGACA AAGATTGAAG 504 0 

3& AAGAATAGTT CAACATATAC TAAGACTAAA GTATGAACAT CATTTAGTTC CGGAGCCTAT 510 0 

TCATATTGGT TTCGGAACTG TTTTATAATA ATTAAGAACA CAATGAATG C GTCATTTCAA 5160 

AAATATGTTG TAACAAAGTA GTTTTTAAGC AAACATATCA TCGACATCAA CGAAGATACA 522 0 

40 TAGCGCATTT GGTATTTTAA AACTTATTAT AAAAGGTGAT AGTTATGAAC TATGTTGAAC 5280 

GTTATATTGA ACAGTTTTTG AGAGCAACAG TAAGAAATAA TATCAAGCAC TACCTTTTAA 534 0 

TGCTAGATGA AAAAATGAAA AATTTAGATG ATTATATGCG TTATTTAATT ACTAAAAAAG 5400 

45 

AACAACTTAG CAAGTTAATT GACAGTCTAA TGCTAACATT AGAAAATAAA TATATTGATA 54 60 

TTGCTGAAGC ATTTCAAATT CAATG TGCAA GAGAAATCAA TAATCAAGAA ATTGAAAATA 552 0 

TTAAATCAGA GTTGAATAAA GTTGAAGCAT ATTATGCACA AATTGAAACT CAAATTCAAC 558 0 

50 

AAACTTCAAC TGAAAAAATA GCAACAGAAA AAACATCGTA TCTAATAAAT TATATGAACG 564 0 

CTGTGGCATA GAAAGGCGGC GAAACATGAC ACACAAATAT ATATCAACGC AAATGTTGAT 570 0 
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CTTTTTACTC GTTCTATTAT TGGGATGTGT ATTAGTTTAT GTAGGATATC TTTATTTTCA 5 82 0 

TAAAATACGT GGCCTTTTGG CGTTTTGGAT AGGCGCGCTA TTAATTGCAT TCACATTATT 5880 

GTCTAATAAG TATACAATCA TCATCTTGTT CGTCTTTTTA TTATTACTTA TTGTGCGTTA 5 94 0 

TTTAATACAC AAGTTTAAAC CAAAAAAAGT AGTTGCGACG GATGAGGTTA TGACTTCACC 6000 

ATCTTTTATT AAACAAAAGT GGTTTGGTGA GCAACGTACA CCAGTTTATG TATATAAGTG 6060 

GGAAGATGTA CAAATTCAAC ATGGAATTGG CGACCTACAT ATTGACTTAA CAAAAGCTGC 612 0 

AAATATTAAG GAAAATAATA CCATTGTTGT TAGACACATT TTAGGTAAAG TGCAGGTTAT 6180 

ATTGCCGGTT AATTACAATA TTAATTTACA TGTAGCTGCT TTTTATGGAA GTACTTACGT 624 0 

GAATGAAAAA TCATATAAAG TTGAAAATAA CAATATTCAT ATTGAAGAAA TGATGAAACC 63 0 0 

GGATAACTAT ACAGTTAATA TCTACGTATC AACGTTTATC GGAGACGTAG AGGTGATTyA 63 60 

TCGATGAAyC ACT 63 73 
(2) INFORMATION FOR SEQ ID NO: 228: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 44 8 8 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 22 8: 

ATAGnGAAAG CGTTTTACAC TTAATAACTC CCTCTTAAAT GCATCCAGGT TCTATGTAGT 60 

AAATCATGAA nATAACATAT AAATn TAG AG GAGATTTACC TTTGAATACA GAGAACAACA 12 0 

AGAATCAAAA CCAATCTGTT AAAAATTCTG AAAGaCGCGG CATGTTAAAA GGATGCGGCG 18 0 

GTTGCCTTAT TTCTTTTATT TTATTAATAA TCTTATTATC AGCCTGTTCA ATGATGTTTA 24 0 

GTAATAATGA CAATTCCACT AATAATCAAT CATCAAAAAC GCAATTAACT CAAAAAGATG 300 

AAAATAAAAA TGAAGATAAG CCTGAGGAAA AATCAGAAAC AGCAACAGAT GAGGATTTAC 360 

AATCAACCGA AGAAGTACCT GCAAATGAAA ATACTGAAAA TAATCAACAT GAAATTGATG 42 0 

AAATAACAAC AAAAGATCAA TCAGACGATG ATATTAACAC ACCAAACGTT GCAGAAGATA 4 80 

AATCACAAGA CGACTTGAAA GATGATTTAA AAGAAAAGCA ACAATCAAGT AACCATCATC 54 0 

AATCCACGCA ACCTAAGACC TCACCATCAA CTGAAACAAA CACGCAACAA TCATTTGCTA 60 0 

ATTGTAAGCA ACTTAGACAA GTATATCCGA ATGGTGTCAC TGCCGATCAT CCAGCATATC 66 0 

GACCACATTT AGATAGAGAT AAAGATAAAC GTGCATGTGA ACCTGATAAA TATTAAACAA 72 0 
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GGGAGATTTT TTAGGCATGA 


GCAATCAATT 


CAAAAGCGAA GAAGAGCGAA GACAATGGGA 


840 




ACAATTCCAA GCTTTCCAAA 


ATCAACAAAA 


CCAACAGAAC CAGCAATACG 


GACAAAAGAA 


900 




ATCTAAAAAA GGATGGTTCT 


GGGGCTGTGG 


TGGTTGTCTA GTATTATTTA 


TTTTAATTAT 


960 




CATCGGTATT TCAGCTTGTA 


CAGCTGGTAT 


TACAGGTAAC CTTGGCGGAA 


ATAGTT CTAA 


1020 


10 


AGAAACGAAC AAAACCCATA 


AAATCGGTGa 


AACTGTTAAA AATGGCGACC 


TTGAAGTCAC 


1080 


TGTAAATTCA GTGGAAACTA 


TGAAATCTGT 


AGGACCATCT CTTGCACCAA 


CAAACGCTAA 


1140 




AGGTATATTT GTCGTTGCTG 


ATGTGACGAT 


TAAAAACAAA GGTAAAGAAG 


CGTTAACAAT 


1200 


15 


TGATAGTTCA ATGTTTAAGC 


TAAAATC CGG 


TGATAAAACA TTTGAAGCAG 


ATAATACAGG 


1260 




TTCAATGTCT GCTAATCAAA 


GTGACAATGG 


TAGTATAGAA AATTCATTTT 


TCTTACAGCG 


1320 




TATAAATCCA GATAGCACTG 


CTCAAGGTAA 


AATTGTTTcG ATGTGTCAGA 


AAACATAGCC 


1380 


20 


AACGCAAAaG ATAAAAAATT 


AGAAGTTATT 


TCTAGTTTAT TTAGCGTCAA 


GAAGATTACA 


1440 




TTTGATTTAT CCGATGCTAA 


AAAAACATCA 


AAAGCTAAAA AAGACAAGCA 


AGATACAGAA 


1500 




GTAGCTG TTG CGAGTTCAAA 


TAG CG ATAAT 


GTAAGTTATG AAGCTTCGGC 


TACTACACCT 


1560 




GcTACAACTT CTAGTGCGGA 


TACTGATTCT 


G AAGATAG CG AAAAGTCTAG 


TAAAGATGAG 


1620 




GATAAGCAGA ATGCGTCTAA 


AAgTGATAAA TCTAGTGTAG AAAAAAGTGA AT CTAATGAG 


1680 




GAAACTGCTC CTGTAGAGCC 


CATGCCCCAT 


AGCAAACCTA CCACTAGTGA 


aGCACCACCT 


1740 


30 


AG CCAAAATA TTCACAaTGa 


AGATAGCmTG 


TACGACGCTT CAACAGAATA AAATtnyCAG 


1800 




tAGCTCGGCT ACCCTTCTTT 


TACGGAAAAA 


TTAATTATAC ATAATCaAAT 


CaAGGAGATA 


1860 


35 


AAAAAATGAA ATTCAAAGCT 


ATCGTTGCAA 


TCACATTATC aTTGTCACTA 


TTAACTGCCT 


1920 




GTGGTGCTAA TCAACATAAA 


GAAAATAGTA 


GTAAATCAAA TGACACTAAT 


AAAAAGACGC 


1980 




AACAAACTGA CAACACTACA 


CAGTCAAATA 


CAGAAAAGCA AATGACACCA 


CAAGAAGCCG 


2040 


40 


AAGATATAGT TCGAAACGAT 


TACAAAGCAA 


GAGGCGTTAA TGAATATCAA 


ACATTAAATT 


2100 




ATAAAACAAA TCTTGAACGA 


AGCAATGAAC 


ATGAATATTA TGTTGAACAT 


CTAGTCCGCG 


2160 




ATGCAGTTGG CACACCATTA 


AAACGTTGTG 


CTATTGTTAA TCGACACAAT 


GGCACAATTA 


2220 




TTAATATTTT TGATGATATG 


TCAGAAAAAG 


ACAAAGAAGA ATTTGAAGCA 


TTTAAAAAGA 


2280 




GAAGCCCTAA ATACAATCCA 


GGTATGAACA 


ATCATGATGA AACAGATGGT 


GAGTCAGAAG 


2340 


SO 


ACATTCAACA TCATGACATT 


GATAATAACA 


AAGCAATTCA AAATG A CAT A 


CCAGATCAAA 


2400 




AAGTCGACGA TAAAAATGAT 


AAAAATGCTG 


TTAATAAAGA AGAAAAACAT 


GATAATGGGG 


2460 




CAAATAATTC TGAAGAAACT 


AAAGTTAAAT 


AATGGCATAC TTTGATTAAT 


CGTAATTTTT 


2520 
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ACTATGCATG GTCTTTTTAA TCAACTTAAA CTCGGCATTA TTTCAATCGA AAA CG CAG AG 2640 

CATACGCTTT TTACACCTTA TATGTTGGAA ACGCTCTCTT CCCTAGGCGT GAAAGACAGC 2 700 

ATTGTCGATT TAATTCATAA AGGGACTGAA TTAGAAGACT TTGCGGCATT TAATTTATCA 27 6 0 

ATTGAAGACA CAGTTACAGT CTGTTTACAA AGAACTGAAG AACTATTAAA ACAATACAAA 2 82 0 

AATGTGGAAT TCAATGACAA AAT ATTAAT C AATTGGCGTA TTATACAAGA GAAATAGACA 288 0 

TATAAAAGTC GAATGTAACt ACGTGAGTAT TGATTTTATT CTTTGTAAAT TACAAGCATT 2 94 0 

TCATATTATA AAGTTTGAAA AGAGGTATAT TGAAATGGAG AAAAATGAAT ATATAGCTAA 3000 

ATATAATGAA TATAGTCAAT TATTAGACGC TACATACTCG CAAGCTGTAG CATmCCTTTT 3 060 

AAGtAAATaT GGCGCTGTAA CCGATGATTA TTATAAAGaA AAATCATACA CGCGATTTTT 3120 

AAAt GGAGnA ATCAAAAGTA TTTCAAAAGG AAAATACACT AGAGCTAGCG AaGGATTATA 3180 

TTGCCATCAT ATAAGCGAGG ACAAATTCCA AAATCTATCT GATCTAAGAT TCATtTCCAA 3240 

ATTTAAGTAC TCATACGACG TTCAAAAGAA AGAAAACTTA GTGTACTGTG ATCTAATCGA 3300 

GCATTTAATT TTACATGCAA TTATTACAAA AGAATCCCAT GGCCAATTTG GTGTAGCTGG 3360 

ATTATGTCAA ATGATCAAAC CAACAGTCAT TGATTGGTAC ATTGGCGAAT ATAATCCAAA 34 20 

ACCAGCATGG ATGCAAGCCA CCAAAGCACG TGCCTATTTG CCTGGAATAT TAGTAGAGAA 34 80 

ATTACTCATT AAAATTGACG ATATGTTAAA AGGAATAGAA ATATAAGATT TCCTTGAGTC 3 540 

TAGATAAATG ATTAATGTAG ATTTATTTTT TGCTGTTGAG ATTTTGTTAT AGATGTTTAA 3600 

ACCTGTAATT AAATATATTT TATAAAATAG ACCACGCATA CCTATCTATA AACGGrCAAT 3660 

GTTTATAAAT GAGTTTGCAT GGtCTTGAAT TGTATTAAAT TTCTTTTGGT TTT AAT AAAT 3720 

CGACTAGATT TTCACAATAT TTATCAAATA TGTATTCCTA AATTATACAG CCTTAATCCA 3 780 

GCACJCTACTT TCGAAACTTC CAACTTAGTT GATATAAGGT TCAATAGTTT GTTTCGTTCT 384 0 

TTTTCAGATA AACCAGAACT TAAATTGATA TTATTGACTT CATAAAAATT ATAGACTAAT 3900 

GCCTCTATTT GCTTTTTAGG CATAAGTAAG TCGACTGAAA ACTGATTTAC GTCGCTTTCA 3 960 

TAAATCATTT CATGTAAATT CTTTAGACTA TTATCGTTAC TATCTCTCAT TAAGTCTGTA 4 020 

TTTTTAAATA AATAACGGCC CAATTCACGA GCTATTGAAA ATCTTGTATT ATTAATCGAG 4 080 

TGATTATTAT TAATATAGAT TGTTCTTCCA CTTAAATAAC CCGAAGTATT ACCCTCCATT 4140 

TTAATATATC TAACATTTAA ATTAAGTTGA AATAATAGCT TGT CTATGTC AAT AG CAAAG 4200 

TGTTCAGAAG TAATAAAAAG TTGATCCATT TTGTCCTTTA TAAATGCCTG AAATAATCGA 4260 

ACTATTTTTG ATTCTAAAAT ATCTTCATAA TGAACTTTCT CAATAACTTT CAATTGATTC 4 320 
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AACATTATTA AAATAAAACC CCTCTACTAC TATATGTAAC GAAGGGACAT GATTTCAAAA 44 4 0 

TAAAATACCT TTTTTATAAA TnTATTATAA TATCCCCCAC TATACnAC 44 8 8 

(2) INFORMATION FOR SEQ ID NO: 22 9: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 84 6 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 229: 

TATGGCGCCA TATTAGTTGT AACTGGTTTA AGAGGTCcAa GAAaTATCaA ATAAAGTTGT 60 

tCCTGGGCTT GGTACTGTTA TCTCaATATT GmwTGCaTTT GGTGGTCTAG CTTTTAATAT 120 

TGGTAATATT GCTGGTGCCG GTTTAGGTTT AAATG CAATT TTTGGATTAG ATGTAAAATG 180 

GGGCGCAGCT ATTACTGCAA TCTTTGCAAT ATTAATCTTT GTAAGTAAAA GTGGCCAAAA 24 0 

AATTATGGAC GTTGTTTCAA TGATTCTTGG TATTGTGATG ATTTTAGTTG TGGCATATGT 3 00 

GATGTTTGTT TCTAATCCAC CTTATGGTGA TGCTTTTGTG CATACATTTG CGCCAGAACA 3 60 

TCCAATGAAA TTAGTCTTGC CCATCATTAC GTTAGTTGGT GGAAcTGTar GTGGTTATAT 42 0 

TACCTTTGCA GGTGCACATC GTATATTAGA CTCTGG CATT AAAGGTAAGC AATATTTACC 4 80 

ATTTGTAAAT CAATCAGCAA TTGCTGGTAT TTTAACTACA GGTATTATGA GAACGTTACT 54 0 

ATTCCTAGCG GTATTAGGAG TTGTTGTAAC AGGTGTGACA CTAAGTTCTG AAAATCCACC 6 00 

AGCGTCAGTT TTTGAACACG CAATTGGACC AATTGGAAAG AATATTTTTG GTATTGTGTT 660 

ATTTGCTGCA GCTATGTCAT CAGTAATTGG CTCAGCATAC ACAAGCGCAA CATTTTTAAA 72 0 

AACACTTCAT AAATCACTTA ACGAAAGAAG TAATTTAATT GTGATTGTGT TTATCGTTAT 78 0 

TTCAACAATG ATTTTCTTAT TTATTGGAAA ACCAATCAGC CTTTTAATTA TAGCAGGCGC 84 0 

GATAAA 84 6 
(2) INFORMATION FOR SEQ ID NO: 230: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 230: 
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TCTTTTTAAA AGGTACTAAT ATTTCTTTAG TGAAAATTGA ATCACGGTCG TTTATTGGTG 120 
CCTTGAGTAT ATTATTATAG ACGGAATCTG ATCTAATAAT ATTGATTTTA TACATGATAA 180 
£ ACCTCCTTAT GTTGTCAGCA TAAAGGATAA CGTAACGTGA TTTTCAAGCA GTAATTGTAA 24 0 

CTAATTGAmA AAAATTAAGA AAAGTATGTG AGTGTTCCTA AwTAATATGa TTAAAATGAT 300 
GGCGAATAAG TGTCTaAAAG CATCTTAAAG GGACATTGTA TAGGGTAAAT CACTTCATAA 36 0 

ATAAGGGaAA ATCCTTATGT TCACTTTTTC ACAATCATnA T AAAAT A TAT ATGTAGTCAA 4 20 

TACTTTGTCT ATATTGAATG TTTTCATATA AATGAAAGCA TTTTTAAATA ACATTGACCT 4 80 

1S CTAATATATA GGCAGA GTAT TGATATCTAT TAAAAAATAA ATGATTTTGA TGAAGGTGAA 54 0 

ACGTATG TAC AAAACAAAAG GTGGCTTTCA ACTTACATTA CAAACATTAA GTTTAGTGGT 600 
TGGGTTTATG GCTTGGAGTA TAATTGCGC C ATTAATGCCC TTTATTAAAC AAGATGTCAA 660 

20 TGTTACTGAA GGTCAAATAT CAATCATTTT AGCGATACCA GTTATTTTGG GATCGGTGCT 720 

CCGTGTGCCA TTTGGTTATT TAACAAACAT TGTTGGCGCT AAATGGGTAT TCTTTACTAG 780 
TTTTATCGTA TTGTTATTCC CGATATTTTT CTTAAGCCAA GCACAAACAC CGGGTATGTT 84 0 

25 AATGGCTTCA GGATTTTTCC TTGGTGTAGG TGGTG CAATT TTCTCAGTTG GTGTTACATC 900 

AGTTCCTAAA TATTTCCCTA AAGAAAAAGT AGGTCTAGCA AATGGTATTT ATGGTATGGG 960 

AAATATCGGT ACAGCAGTTT CTTCATTTTT AGCACCACCG ATAGCGGGTA TTATTGGTTG 10 20 

30 

GCAAACAACA GTTAGAAGTT ACTTAATTAT TATCGCTTTA TTTGCATTAA TTATGTT CAT 1080 

TTTTGGTGAC ACACAAGAAC GTAAAATTAA AGTACCATTA ATGGCtCAAA TGAAAmCATT 114 0 

3S ATCTAAAAAC TACAAATTAT ATTACTTAAG TTATTGGTAT TTTATTACTT TTGGTGCTTT 12 00 

TGTAGCATTT GGTATTTTCT TACCTAACTA CTTAGTAAAT CATTTTGGAA TTGACAAAGT 12 60 

AGATSCTGGT ATTCGATCAG GTGTATTCAT TGCGCTGGCA ACATTCTTAA GAC CAATAGG 13 2 0 

40 TGGCATTTTA GGTGATAAAT TTAATGCAGT TAAAGTATTG ATGATTGATT TTGTTGTTAT 1380 

GATTATCGGT G CCATTATTT TAGGTATTTC AGACCATATC GCATTATTCA CTGTAGGCTG 14 4 0 

TTTAACAATA AGTATTTGTG CAGGTATTGG TAACGGCTTA ATCTTCAAAT TAGTACCATC 1500 

45 ATACTTCTTA AATGAAGCGG GATCCGCAAA TGGTATCGTA TCAATGATGG GTGGTTTAGG 1560 

AGGATTCTTC CCACCACTAG TAATCACGTA CGTAGCTAAT TTAACAGGAT CAAGTCATTT 162 0 

AGCATTTATT TTCTTAGCGG TATTnGGAnG TATTGCATTA TTTACCATGC GTCATTTATA 1680 

50 

CCAAAAAGAA TATGGCTCAT TGAAaAACGG TTGATATGTA ATACATGCCA TTcATTTAGT 174 0 

TAAATACAAA GCCTTaATAT CATGCGCAAT ATTCGTAGCA TGACATTAAG GCTTTAGTAG 1800 
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CTTGGTTTGA TTTTAGGCAA GGTAATGGTT AATAACCCAT TTTCAAAACT AGCAGTAATA 1920 

TGTTGCTTAT CAACAGCTTC AAAATCAAAT TGACGCATTA ATGATTCGAA GTTACGCTCA 198 0 

TCTAAAATGA GTTGTTCAGA TTTGTATTTT GCGCTTCTAG TAGCTTGAAT AGTGAGCGwA 204 0 

TTAt t ATTGA AATCg ATACT AATAtCTccC TG 2 0 72 



(2) INFORMATION FOR SEQ ID NO: 231: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3159 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
)5 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 231: 

20 CGTCTTCTCT TGGTTATTCT CTGTGTTTTG TCTTTGTTCA AATTCGATTT TTTGTTGTTC 60 

GAATGAATGT AATACTTTAT TTTTTTTTGG CACATAATCC AAGTnATTTT TAGGAATTAA 120 

TATACGGTCT TTAAATGCTT CTTGTATTTT GCTCACAATC AATTGGTATA GTTGCTCTTC 180 

25 

TTTTGATAAA CGCA CTTCTA GTTTTGTTGG ATGAACATTT ACGTCTACTA AGATTGGATC 24 0 

CATTTCAATA TTAATATAAC AAATCGGGAA CCTACCTATT GTTAAG AG TG TATGATAGCC 3 00 

TTCTAAAATC GCTTTATTTA GCATAAAGTT TTTAATGTAT CGTCCATTAA TAAAAATAGA 3 60 

30 

AATATAGTGC TTATTACTTC TAGAATGTTC AGGCTTTGCA ACAAAACCTT CAATGTGATA 420 

ATCACTTGTA TCTCCAGATA TATGTACTAA ATCTCGTGCA ACTTTCATCC CATAAATCTC 4 80 

3S TGCCATCACT TCATTAGTTC GTCCTGAACC ATTTGTACTT AACATTGTTT TGCCATCTGA 54 0 

AATGAGTGCT ATTCGAATGT CCGGATGGCT CATTGCCATT CTGTTGACAA TATCTGTTAT 6 00 

TTTACCTAGT TCAGTGTATA AACTTTTAAT AT AT TTTAAA CGTGCTGGTG TATTATAAAA 660 

40 TAATGATTCT ACAAGTATAT CTGTTCCTTT TTTCGCTTTT GCAGGCTTAT GATTTAATAT 72 0 

TTCACCATTT TCTACATATA TTTCATTTCC ATTAGCATTA TCCGTGCAAG TCTTCAATGT 78 0 

TACTTTAGCA ACTGATGAAA TACTGGCTAG TGCTTCACCA CGGAATCCTA ATGTCCTAAT 84 0 

45 ATGAAATAAA TCTTCATCTT GATCTAATTT ACTAGTCGCA TGTCTATGAA ATACT AATCC 90 0 

TAAGTCTTCC GCTTCAATTC CGCTTCCATT ATCGACTACG CGAATAGATT GGACGCCAGA 960 

tTCCTCTACT TCAATGCTTA TTTCTGTAGC GCCTGCATCT ATAGCATTTT CCAACAGTTC 1020 

50 

TTTCACAACA GAACTCGGTC TTTCAACTAC TTCACCTGCT GCGATTTTAT TTGCTAATGA 108 0 

GGTTTGGAGT TCTTTAATTT TCCCCATTTT GCAACACCTC TATTTTAATT GATTTTGTAA 114 0 
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TTGTAGTTCA ATCTCGCTTT TTTGATCATT 
GTCTTTTTGA GATAAAGTAT CaGTTGTTTC 

5 AATTTCCAGG TTCATTTTCG ACCATTTTTA 

ACGCTTCAAA CTCGCTTAGA ATCACTTGTG 
CTAATTTCGC AACTTGAATA CCATAAtATC 
GAATATAAGT TCACCTTTAT ATTCATTAGC 
TGCTTGATCT AATGTTGTCA ATTCATGATA 

JS TGTTTCAGCT ACATACTCTA TCATTGCCTG 
ACCACGTCCA ATTTCATCGA AAATAATCAA 
TTGTGCTTCT AGCATTTCTA CCATAAACGT 

20 ACCTATTCTA GTGAATATTT GATCAAATAT 

AGCTCCCATT TGGGCCATTA TACTAATTAT 
AGACATATTC GGACCTGTAA TTAAATATAT 

25 AGGCACATAG TCATTATAAT CCATTACTCT 

TTCTAATGTT TTATTTT CAC TAAATGAAGG 
TGCAAAGCTC TGTAAACAAT CTAGCTCTGA 

30 

AGTATATTTT TTAACTTCTT CACGTAGCTG 
TTTGTCTTCC GCACCTAAAA TGATATCTTC 

3S TTCAGCATTC GATAACGTTT GCTTCCTCAT 

CAAGTTGGCA CGTGTTATTT CTATAAAATA 
TGATTTTATT CCTGTACGTT GTCTTTCTTT 

40 GTTTTTTGAA GCTTCAAGAT ATTCATCTAA 
GCCATCTTTA ACTGAAATTG GTGGTTCTTC 
ATCATCaAGG GGTTCTAGTT GATTAACTTG 

45 TAATGCTTTA ATATTCGGTA TTTCAGAAAT 
ATTAACATTT CCGTAACTAA CACGCCCAAC 
ATATGTTCTT AAGGTGTCTC TTTCTATGAA 

SO 

TCGTG CTTCA ATTTGTTCTT TACIT ATTAG 
TGCTCCCATT GGTGTTTTCG TTTCGTCCAT 

55 



TTCAAACAAA TcAAATGATG CyTGTTCAAA 12 6 0 

TTCaACACTT aAGTTTAAAT TTTCTTGATT 132 0 

AATTTGATAT CGATGATt TT TCACCAGCAG 13 8 0 

CTCTGCTAAT AACTTTTTCA GGTAAATCAG 144 0 

GTCAACTGCA CCATCTTTGA CTTTATGCAA 150 0 

AGCGACGTGA ACATTTTTTA GACTTGGTAA 156 0 

ATGTGTTGAA AATAACGTTT TAGCATGTGA 1620 

CGCTAAAGCT AAACCGTCAT ACGTTGAAGT 1680 

ACTATCCTCT GTTGCATAAG TTAATGCCTT 174 0 

ACTCTTACCT GAAACCAAAT CATCTGCCGC 18 00 

AGGTAACACT GCCTCTTTAC AAGGGACATA 186 0 

GGCAACTTGT CTCATATATG TCGATTTACC 1920 

AAATGTTTCA TTATCTAATC GACAATTATT 198 0 

TTCCACTACT GGGTGCCTAG ATT C CACTAA 2 04 0 

CCTAGTGTAA TTATATTTTT GAGCAATTTC 2100 

AATAATTTTA GCTTGTTGTT GTAAACGTTC 2160 

AACAAATAAT TGATATTCTA ATTCGATGGC 2220 

TTTTTCTTTA AGTTCATCAG TTATAAAACG 2280 

ATAACCAAAT TCACTTGGTT CAAAATTTTG 2 34 0 

ACCAAACACT TTATTAAAGC TTATTTT CAA 2 4 00 

GGCTTGTAAT TCTGCTAACC ATGTTTTTCC 24 60 

TTGCGTATTA AAACCAACTT TGAATAGTCC 2 520 

TACTAAACTC TGTTCTAATA TATCAAGTAA 2 58 0 

TACAAGAGTA TTCTGATTCA TAGAATTTAG 264 0 

GGAATGTTTA AGTTGAATTA AATCTCTCGC 2700 

AAGACGTT CA ATATCATACA CTTGATTAAG 2 760 

ATGAGCACTA AATTCATCAA CGATATCTAA 2 820 

TGGTCTATCT ATCCATTGTT TTAAGCGGCG 2 880 

TAGCCAAAGT AGCGTTCCTT TTTTTGATTT 2 94 0 
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ATCTATAGCT GCATATTGAA CAACATCCTC GATATGCGAT AAATCACGTT TTTGTGTATG 3 060 

ATGAATATAA TCTAGCAATA ATTGTGTCGC TTGATACaTT AATTTATGTT CAGTTTGATT 312 0 

CACACTATAG ATTt CTGATG ATAACGTTTC CCTGACTGT 315 9 



(2) INFORMATION FOR SEQ ID NO: 232: 

(i) SEQUENCE CHARACTERISTICS: 
to (A) LENGTH : 1238 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

is 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 232: 

TAAGCGAGAA GCAATTGGTG TTATGTATGC TAGTGATAAA CCAACAGGTG AAAGTACAAG 60 

20 GTCATTTG CT GTTTATTTCT CTCCTGAAAT TAAGAAATTT ATTGCAGATA ATTTAGATAA 120 

ATAAATCATC CATCCATACA TTGATAAATG ATTTTyAGAA ATTAACAACA AAATCAACAA 180 

TTTTAAACAT CTCTGTGATT CTATTTATTC GAAATGATTT AAAAAATAAA ACTTCAAAAA 24 0 

25 CCTAACCTTA TATTTATACG AATACTTAGA GGAGCACAAA AATGAATAAA AATATAATCA 300 

T CAAAAGT AT TGCAGCATTG AC GATTTTAA CATCAGTGAC TGGCGTCGGC ACAACAGTGG 360 

TTGAGGGTAT TCAACAAACG GCTAAAGCTG AACATAATGT GAAACTAATC AAAAATACTA 4 20 

30 

ATGTAGCACC ATA CAATGGT GTCGTTTCGA TAGGATCTGG AACAGGTTTC ATTGTCGGTA 4 80 

AAAATACAAT TGTTACCAAC AAGCATGTCG TTGCAGGTAT GGAAATTGGT GCACATATTA 54 0 

^ TAGCGCATCC CAATGGTGAA TATAATAATG GCGGATTTTA TAAAGTTAAA AAAATTGTCC 6 00 

GTTATTCAGG TCAAGAAGAT ATTGCCATTC TACATGTGGA AG ATAAAG CT GTTCATCCAA 6 60 

AAAACAGGAA TTTTAAAGAT TACACAGGCA TTTTAAAAAT AGCATCAGAA GCTAAAGAAA 7 20 

40 ATGAACGCAT TTCAATTGTT GGCTATCCAG AACCATATAT AAATAAATTT CAAATGTATG 7 80 

AGTCAACAGG AAAAGTGCTG TCAGTTAAAG GCAACATGAT TATTACTGAT GCTTTCGTAG 84 0 

AACCAGGCAA CTCAGGTTCA GCTGTATTTA ACAGTAAATA CGAaGTtGTA GGTGTTCACT 9 00 

45 TTGGTGGAAA CGGCCCTGGA AATAAAAGTA CAAAAGGATA TGGTGTTTAT TTCTCTCCTG 960 

AAATTAAGAA ATT CATTGC A GATAACACAG ATAAATAAAT CCTTACATAG ATAAATGATT 1020 

TTAAAAATTA ACAACAAACT CAACaATTCA AATCATCTCT GTG ATTC CAT TTATTCGAAA 1080 

50 

TGATTAAAAA AAATAAAACT TCAAAAAGCT AACATTATAA TTATACAAAT ACTTAGAGGA 114 0 

GCAGAAAAAT GaATAAAAAT ATAATCATCA AAAGTATTGC AGCATTGGAC GATTTTTAAC 12 0 0 

55 
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(2) INFORMATION FOR SEQ ID NO: 233: 

(i) SEQUENCE CHARACTERISTICS : 
s (A) LENGTH: 6444 base pairs 

(B) TYPE : nucleic acid 
!C) STRANDEDNESS : double 
(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23 3: 





TGATAAGTCA 


TTTAAATTGT 


CACCTATTGA 


CATGACTTCT 


TTCATTTCAA 


TCCCTAATCT 


60 


15 


TTCGGCAATT 


GTTTCTAGCG 


CAATACCTTT 


TTGTGCATCT 


GAATGCGTTA 


TTT CTATATT 


120 




TCCTCTCGAA 


GATGATGATA 


TAG CT AAATT 


CGGAGAkTCA 


GCTAAAATTT 


TACTAG CTTT 


180 




GTCAATTTTT 


TCTAAATTTC 


CAT CAAATGC 


TAATATTTTC 


ATAATTAATT 


CACCAGGTAT 


240 


20 


GTTTTCAATA 


GCATCATAAT 


TATCAACAAC 


TyTCAACGTA CCATTATCTA 


TGCGTCTTTG 


300 




AATACCATTT 


TTAATACGCT 


CAACGTTTGC 


ATGTTGACCT 


GCACGCTCAG 


CAATATCTAT 


360 




GTAAATGTCT 


AAATCTCTTT 


GTGGATCTTC 


AGTATAAATC 


GCACGACTCG 


TGTATACTTG 


420 


25 


ATAATAAATA 


CCTGCATCTT 


TTAAAACATT 


TGTAATTTTG 


TGTACTAACG 


ATTTATTAAG 


480 




GTGTGAAGTG 


CTCATTACAT 


TGAAAGTTTC 


ATCACGTACT 


TCAGCAC CAT 


TCAAACAAAT 


540 


30 


ATATGGTACT 


GTTAAATCTG 


TGTCAGCAAC 


TGGTGCTTGk 


GCTTCATAAA 


ATGCTCGACC 


600 




TGTCGCGATA 


ACAACCGTTA 


TCCCTTGTTC 


TTGAGCGTAT 


TTAATCGCAT 


CAATATTAGG 


660 




TT GAG AAATT 


TCATGTGCTG 


CATTAAGTAG 


CGTGCCATCC 


ATATCAGTGG 


CTATTAGTTT 


720 


35 


TATCATTATG 


TnACCTCGTT 


TCGTAAATnT 


AAAATCTTGT 


TCTTAAATAA 


G r ATATATAC 


780 




TCAGCGCACA 


TACTTTtCTA 


TTAmCATTTA 


TAT kGTCATT 


aATTTATCAT 


ATAATGTAAT 


840 




TCTaACAAAT 


nTTAAtTAGT 


ATGTACTATC 


GT CTAATTGG 


TGGATTTCTT 


ATTGGCTCTT 


900 




AAgTTTTTAA AAAATGTTGT TAATAATGTG 


CTACATGCTT 


CTTTAAGTAC 


ACCTTTATCA 


960 




ACAATTGCAC 


GATGATTAAA 


ATTAGATTGT 


TGCAATAAAT 


TCATTAAACT 


GCcACTACAA 


1020 


45 


CCAC CTTTAG 


GATCATCTGC 


GCCATAGACG 


ACTCTTGGAA 


TGCGACTCAT 


TACAATTGTT 


1080 




CCTGCGCACA 


TGACACATGG 


TTCTAAGGTT 


ACATATAATG 


TGCAACCTTC 


TAAACGCCAA 


1140 




CTACCTAACA 


CTTTGGCTGC 


ACGTTCAATT 


GCAATATGTT 


CAGCATGCGC 


CGTTGGTTGT 


1200 


SO 


TGTAGTGTTT 


CTCTTaAATT 


ATGTGCTCTA 


GCGATAACTT 


CATCATCTTT 


AGTGATGATA 


1260 




GCACCTATAG 


GTACTTCGCC 


TAGTTGAG CT 


GCTTTTTTAG 


CTTCTTCAAT 


CGCTAATGTC 


1320 




ATAAAATATA 


TATCATTTGT 


CATTTATGTC 


CAGATACCTC 


ACTTATGGTA 


CAATACTCAA 


1380 
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CTATTGGCGT 


AGGTAAATCT 


TCACTTGCAC 


ACAAATTAAG 


TCAAACTTTA 


GATTTTTATG 


1500 




AAGAAAAAGA 


AATCATCACA 


GAAAATCCAT 


TTTTATCAGA 


CTTTTATGAA 


GATATCTCTA 


1560 


5 


AATGGAGTTT 


TCAAACTGAA 


ATGTTCTTTT 


TATGCAATAG 


AT ATAAG CAA 


TTTCAAGATG 


1620 




TAACACAACT 


AAATCAAGGT 


GTAGTTAGTG 


ATTATCATAT 


ACATAAAAAT 


AAGATATTTG 


1680 




CTAAAAATAC 


TTTGAGTTCT 


GTTGAATTTC 


AGAAATTCAG 


TAAAATTTAT 


GATATTTTAA 


1740 




CTGAAGATAT 


GATTATGCCG 


AATATGATTA 


TCTTTTTAGA 


TGCAGACCTT 


GATGTGTTAA 


1800 




AATCTAGAAT 


TGCTAAACGT 


AAC CGTAGTT TTGAGCATCA AATAGAaGtG ACAcTGTaAg 


1860 


15 


TTAAAAAAAG 


ATTATCGTGA 


GTATTATGAG 


TCCTTACAAA 


GTAATGGTTC 


AAATGTAGTT 


1920 




TTAAT CGATA 


CnACTTCTAT 


TGATTTTCTT 


AAAAATGAAC 


AAGATTACGA 


AGATATATTA 


1980 




CATATTATAT 


TACCTATGAT 


AGGAGATATT 


ACCAATGAAT AATTACGGTA 


TTCCACAAAA 


2040 


20 


TGCCATTATA 


ACCATTGCAG 


GTACAGTTGG 


TGTTGGAAAA 


TCAACACTAA 


sGCAAGCACT 


2100 




TGCAGATAAA 


TTAAACTTTA 


AAACGTCTTT 


TGAAAATGTC 


GAACATAATC 


CATATTTAGA 


2160 




TAAATTTTAC 


AGCGATTTTG 


AACGATGGAG 


TTTCCATTTG 


CAAATTTACT 


TCTTAGCTGA 


2220 


25 


ACGTTTTAAA 


GAACAAAAGC 


GTATGTTTGA 


ATATGGTGGT 


GGCTTTGTCC 


AAGATCG AT C 


2280 




AATTTATGAA 


GATGTTGATA 


TTTTTGCAAA 


AATG CATGAA 


GAAGAAGGCA 


CAATGAGTAA 


2340 




AGAAGATTTC 


AAAACATATT 


CAGACTTATT 


TAATGCCATG 


GTCATGACAC 


CTTATTTTCC 


2400 


TAAACCTGAT 


GTAATGATTT 


ATTTAgAATG TAACTATGAT GAGGTCATTG ATCGTATTAT 


2460 




TGAACG TGGT 


CGCGAAATGG 


AAATTAATAC 


AGACCCTGAA 


TACTGGAAAA 


AGCTATTTAA 


2520 


35 


ACGCTATGAC 


GATTGGATTA 


ATAGCTTTAA 


TGCATGTCCA 


GTTGTACGTA 


TCAATATTAA 


2580 




TGAATATGAT 


ATCCATAAGG 


ACCCCGAATC 


TTTAAATCCT 


ATGATAAACA 


AAATTGCTCG 


2640 




AATTATTCAA ACATATCGAC 


AAGTAGATAC 


ACGATAAAAG 


ACTAAAGACA 


TAGCGTATAT 


2700 


40 


GTTTATATTC 


AATGTATATT 


CCATAGATAT 


TATCGATTAT 


TTTATCAATT 


CTATCGAATA 


2760 




CATTAATTCA 


CATATACACT 


ATGTCTTTCT 


TTTTAATTTA 


AAGCTTCTAA 


AATATCTGCC 


2820 




GCACTATTTA 


AAATAATATC 


AGCTTCATGT 


AATTCTTCTT 


TTGTTGCAAT 


ACCTGTTAAT 


2880 


45 


ACACCTATTG 


CCATACCTAA 


ATTTGCATTA 


CTTGCTGTCT 


T CAT A TCATT 


AGCAGTGTCT 


2940 




CCTACTATAG 


CTACTTTCTG 


AGGATCTACA 


TTATATTGCT 


CAAATAAAGG 


CGATAATACT 


3000 


50 


TTAGGATTTG 


GCTTCTCATA 


GGCATCCGCT 


TCGGTAGAAA 


TGATCAAATC 


GAACAACGAG 


3060 


GTAGCATTGG 


TATGTGCTAA 


AAATTGTTCT 


ACACCTTTTT 


TAGTATCACT 


CGTAACAATA 


3120 




CCAAG TTGAT 


AGCCTTTTGC 


TTTCAAATCG 


ATAAGTGCTT 


CTTTAACACC 


TTCTACCCAA 


3180 
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GTATCTTGTC CCGTCACATC ATTAAATGCC TGGATAATTT GTTGTAAAGA TCCTGAACCC 33 0 0 

ATCACTGATT TTGGATCAAT AGATTCTTTA ATGACACCGA GTTGTCTTAA AGCAGCTT CT 336 0 

5 

TTATTATGTA CTGGGAAAGT CTCAAGCAAT GATTGTACAA ATCGTACCCC TATTTTTTCC 342 0 

CAACTTCTAT CAAATTCAAT TAAGGTACCA TCTTTATCAA ATAATATCCA TTCCATTGaT 34 8 0 

ATCAATACTC CTATTTATTT ATTTCGTATT ATGCTGATTC TATGATATTC GTTATCCCCT 3 54 0 

GAAAATGAAC TCGTAGTATT GTTCTATTTA AATATTGaAT TAAATATAAT AATAAGTGAA 3 60 0 

ATCCCCTTCA ATACTTAACA ATAAACATTG TAAACTTAAT TTATTACCAT GCTTCGCTTC 3 66 0 

)5 ATTGAAAGGG ATTTTAGTCA TGATTAACTT TTGCATATTG TTTTCATGAT TATATTCAAT 3 72 0 

TTTTATTAAT ATTTTGGTAC AACGACTCTC CAACCATTTT TATCTTCTAA AGTACCATTT 378 0 

TGAATACCAG TATAGACGTC GTATAATTTT TGAGTAATTT CACCAGTCTC ATTATTATTA 3 84 0 

20 ATAACGATTT CACGATCTTC GTATCTCAAT GTACCCACAG GTGAAATAAC TGCTGCAGTA 3 900 

CCACTACCAA ATACTTCTGT TAACTCACCT TTATCATATG ATTCGAATAA TTCATCGATT 3 96 0 

GAAACGCGGC GCTCTTCGAC TTCATATCCT AAGTTTTTAG CTAATTCGAT AATAGATTTA 4 020 

25 

CGTGTAATAC CAGGTAAAAT ACTGCCATTC AACTCTGGTG TAATTACTTT GCCATTTTCA 4 080 

ACGAAGAAAA TGTTCATGCT ACCAACTTCT TCGATATATT TCTGTTCAAC ACCATCAAGC 414 0 

CATAATACTT GGTCATAACC TAATTTATTT GCATTAGTTT GTGCTAATAA ACTTGcCGCA 4200 

30 

TAGTTAC CTG CAACTTTTGC AAAGCCTACA CCGCCACGaA CAGCACGCAC ATATTCATCT 4 26 0 

TCTACATAGA TTTTAGTTGG TTTTAAAGTT TCACCACCAT AATATGCACC TGAAGGAGAT 432 0 

35 AAAATAATTA ATAATTTATA CTGATGTGAT GCACCAACGC CAAGTGCCCC TTCTGTTGCA 43 80 

AAAACAAATG GACGAATATA TAATGATTGA CCTTCCCCTT CAGGAATCCA ATCTCTTTCA 444 0 

ATATCAACTA ATTGTTTTAG CCCCTCTAAC AATTCTGCTT CGTCTACTTG AGGCATTTCT 4500 

40 AATCGTGCTA ACGAGTTATT AAGAC GCTTA AAATTTTCTT CAGGACGGAA AAGTGCAACT 4560 

TCCCCATCTC TTTTATATGC TTTTAATCCT TCGAATACCG ATTGACCATA ATGAACACCT 4 620 

TGTGCAGCAG GTGAAATTTC AATAGGACCA TAAGGTACTA TCTTCAAATC ATGCCATCCT 4 680 

45 

TTATCTGCAT CATAATCATA ACTCAACATA TAATCAGTAA AATATTTACC AAAACCTAGT 4 74 0 

TGAGATGTAT TTGGTTTTTG TTTTAATGTT TCTCGTCGTT CAACTTTAAC TGCTTGTGAC 4 800 

ATGGTGATTG CCTCCTAATA ATATTGTATA AGAATTTGTT TAACTTAAAT TATAACAATC 4860 

50 

CaTATTTTGC TGTTCAACAA ATTTT CT AAA AATTCAAAAT TAATTAACAG ATTTCTAGAA 4 920 

AGACTATATC TTTTAGTATA AACGTATTAA TTTCACAGAG ACAAGTAATC TGTGTTTTAC 4 980 

55 
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TAAGTATAAT GAATAATATT AGAATTCATG CACTAGTTTA TTAAAATAAA GAGTAATTTA 510 0 

AAATAT CATT CCGTGTATTA AAGTGAATGG AAATGATTAG TTATTATTTT TAACAGTATC 51 GO 

5 TTTTTGTTCA ATAGCTTCTA ACATTAATTT AGTCATGCTC GCTAAATCAT ATTTAGGATC 522 0 

AAATCCCCAT TCGCCACGTG AACAGCTTGT ATCAATAGAA TCCGGCCAAC TATTAGCGAT 528 0 

ACCTTGTCTA ATAGGATCAA CATCGTAATC TAATGTAAAA TTGGGATAGT ATTCTTGAAT 534 0 

10 TGCTTCTTTT ACCATCTCTG GATCAAAACT CATTGCGCTC AAATTATAAC CATTTCTAGT 54 0 0 

TTCTAATTTA GCGTCGTCTG CTTCCATAAG TTTAATAATT GCTTCAATTG CATCATCCAT 54 6 0 

ATACATCATA TCCATATACG TGCCTTTATC TATGAAGCTT GTATAATGAC CCTCTCTTAC 5 52 0 

15 

TGCTTTGAAG TATATTTCAA CAGCATAGTC TGTAGTACCG CCACCTGGCT CTTTAACATG 558 0 

CGAGATTAAA CCTGGGAATC TAACACTTCT TGTATCTACA CCAAAACGTT TGAAATAGTA 564 0 

20 TTGACACAAT AATTCTC GAG CTACTTTATT TACACCATAC ATTGTCGTAG GTTGCTGAAT 5700 

CGTTACTTGT GGCGTATTAA CTTTAGGAGT TGAGTCTCCA AATGCACCAA TTGAACTTGG 576 0 

TGTGAAAAAG TGCAAATTAT AAGTTCTTGC AGCTTCTAAT G CATT CATT A ATCCACCCAT 5820 

25 ATTTAAATCC CAAGCTAGAA TTGGATTTTT CTCAGCAGTT GCTGATAATA ATGCTGCCAT 58 8 0 

ATGCATTAGA CTATCCGCTT CAAAGTCCCT AACTAACTCA AACATACGGT CACGATCTGT 594 0 

TACGTCTAAG ATTTCAAATG GTC CATTTTG TACAGGTGAG TCTGCTTCAG GTTCCCTAAT 6000 

30 ATCTGTAGCA AGAACATTAT CTGTCCCATA AATTTCTCTG CACTTAACAA CTAATTCTGT 6 06 0 

AC CAATTTGT CCTAATGCAC CAGTAATCAT AATTTTTTTC ATAGAAATAT CTCCTTTGtC 6120 

TCTTCTATAT AGCTATAGTC CATCACAAGC GGa CATAATA TTCATTTTCA TAATAATTAT 6180 

35 

AATATAAAAG CGCTTTCTTG TATATATGAC ATGTACATGT TGCTGATATk TCTGTAAATG 624 0 

GAAATTCTAG TTGTATTAAT TGATTTTAGT AATTTATAGC GTTTATTATT GCTAATTACT 63 00 

4o GtCAAATTAA ATTTTTTATC CCTCAACTCT TAAACTCTGG ATATCTTTCA TTATATTAGC 63 60 

TTTTTTATAA CCATGGATAT CATGTAAAGC CTTATAAGCn TTAAATAATG TTTCATACCT 64 20 

TTGTACTTnT TCCGCTTCTG GATT 6444 

45 (2) INFORMATION FOR SEQ ID NO: 234: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4721 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

50 (D) TOPOLOGY: linear 

55 
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GCCCATGAGA CAATTTTACT TGCTTTTCCC ATTGGTTATC ACGTTCTTAT TACATAGATT 6 0 

TAAAC CG AG A AATATTATTC AAACGCTATT TATTGTATCG TTGATTTCTT TAGGACTTAT 120 

5 GATAGTGATT CATTTCATCA CTGGAGATAA TTCACGTGTG TATTTTGGGA CAGATACACG 180 

ACTGCAAACT TTATTGCTTG GTTGTATATT AGCATTTATT TGGCCTCCGT TTGCTTTGAA 24 0 

AAAAGATATT TCTAAAAAGA TTGTCGTATC ATTAGATATT ATAGGGATAT CTGGTTTTGC 300 

GGTTCTAATG ACTTT GTTCT TTATAGTTGG AGACCAAGAT CAATGGATCT ATAATGGAGG 360 

ATTTTACATT ATATCATTTG CAACTTTATT CATTATTGCA ATTGCGGTAC ATCCTTCTAG 420 

TTTATTTGCT AAATTTTTAA GTATGAAACC TTTACTAATT ATAGGTAAAC GATCATATAG 4 80 

15 

CTTATACTTA TGGCATTATC CTATCATTGT TTTTGTGAAC AGTTATTACG TACAAGGACA 54 0 

AATACCGGTA TACGTTTATA TTATAGAAAT TTTGTTAACA GCGTTAATGG CTGAAATTTC GOO 

20 GTATCG CTTT ATTGAAACAC CTATACGTAA AAAAGGATTT AAAGCTTTTG CATTTTTACC 66 0 

TAAAAAGAAG GGGCAATTTG CTAGAACAGT GTTAGTTATC CTATTATTGG TTCCGTCTAT 72 0 

CGTTGTGCTC AGTGGACAGT TTGATGCACT TGGCAAACAA CATGAAGCCG AGAAGAAAGA 780 

25 GAAGAAGACG GAATTTAAAA CAACGAAGAA AAAAGTCGTT AAAAAAGATA AGCAAGAGGA 84 0 

TAAGCAGACA GCGAATAGCA AAGAGGATAT TAAAAAGTCA TCACCACTAT TAATTGGTGA 900 

CTCGGTCATG GTGGATATTG GTAATGTCTT TACTAAGAAA ATAC CAAATG CACAAATTGA 96 0 

30 TGGTAAAGTT GGACGGCAAC TCGTTGATGC TACACCAATT GTGAAATCGC AATATAAAGA 10 20 

CTATGCTAAA AAAGGTCAAA AAGTTGTAGT AGAGCTTGGT ACAAATGGGG CATTTACGAA 10 80 

AGATCAATTA AATGAACTAT TGGATAGTTT TGGAAAAGCA GACATATATT TAGTTTCTAT 1140 

35 

TAGAGTACCT AGAGATTATG AAGGTAGAAT AAATAAATTA ATTTATGAGG CAGCTGAAAA 1200 

GCGCTcTAAT GTACATCTAG TCGATTGGTA TAAAGCTTCT GCAGGTCATC CGGAATACTT 1260 

4Q TGCATATGAC GGTATTCACT TAGAATATGC AGGTAGTAAA GCGCTGACTG ATTTGATTGT 13 20 

AAAAACGATG GAAACACATG CTACAAATAA GAAATAATTT GATGCACTAA ACTTTTGAAA 13 80 

TATTACATTA CTTCTGATAT TTATTATCAA AAATGATGTA TTTCATTAAA AGTTTAGTGC 1440 

45 TTTTTTATTT TCAAATCCCA TAGTAACGGT GCAGAAAAAG TGTTGTAAAC ATT CTAATTG 1500 

GTATATTACA TTCAATGAAG CTTTATTAGG AACAGATTAC ATTATGATAA CAAAGCCCGC 1560 

AAGACACCTA ATCTCTGTTA TAGTTTGTTT TGTCGCAAAA CTATAAAAGT TATAATTGTT 1620 

50 TGCATACTAA AAAAATAAAA AATATAAAAT TTAAAATAAT TGAGTCGCTA ATGACTATAT 16 80 

GTATAGAGTG TTTTGATTAT TGGGAGGATA TTTAATTATG AAAAAAATCG TTACAGCTAC 1740 
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ACAAAATAAC AATGGATATA ATTCTAATGA CGCTCAATCA TACAGCTATA CGTATACAAT 186 0 

TGATGCACAA GGTAATTATC ATTACACTTG GACAGGAAAT TGGAATCCAA GTCAATTAAC 192 0 

GCAAAACAAC ACATACTACT ACAACAACTA CAATACTTAT AGTTATAACA ATGCATCTTA 198 0 

CAATAACTAC TATAATCATT CATATCAATA CAATAACTAT ACAAACAATA GTCAAACAGC 2 04 0 

AACAAATAAC TATTATACTG GTGGTTCAGG TGCAAGTTAT AGCACAACAA GTAATAATGT 210 0 

TCATGTGACT ACAACTGCAG CGCCATCTTC AAATGGTCGT TCAATTTCTA ATGGTTATG C 216 0 

ATCAGGAAGT AACTTATATA CTTCAGGACA ATGTACTTAT TATGTATTTG ATCGTGTTGG 2 22 0 

TGGGAAAATT GGTTCAACAT GGGGTAACGC AAGTAATTGG Get AACGCAG CTGCATCATC 2280 

TGGCTATACA GTGAACAATA CACCAAAAGT TGGTGCTATC ATGCAAACAA CACAAGGCTA 234 0 

TTACGGTCAT GTTGCTTACG TTGAAGGCGT TAACAGCAAC GGTTCTGTTC GTGTTTCAGA 24 00 

AATGAACTAT GGACATGGTG CTGGTGTGGT TACGTCTCGT ACAATTTCAG CAAACCAAGC 24 6 0 

AGGTT CATAT AATTTCATTC ATTAATCAAA TGTAAAT CAA ATGACGTCAA TATTCTCTAA 2 52 0 

CATGAGAGTA TTGGCGTTTT TGTTTTATAT AAATATAAAT GAGAGCGGTT TATTCACTGA 2 58 0 

TCTTTAGGGA ACTAAGTAAT AAAGTGATAA TTTATACTAT GTCAGTATGA TTGAGAGTGA 2 640 

TTCAATTTAG ATGAAAACCA TGAAAAAATA TATTAAAACA GCATTTTTTT GTAGTATGTA 270 0 

TTGGTTAATT GTTCAACTAA ATATAGCAAA TTTAGGTACA AGAATTCCTG ATAAGTATTT 276 0 

TCGTCAGAAG TACATAATAT TTAAATCATT TAACTTTGAG AAGCATGGAA AATTTTGGAA 2 82 0 

CAAATGGTTT TACG TAAGAA AATGGAAACA TAAGATTTTA GATGGTCATC AGCTTAATCA 2 88 0 

AAATATATAT GATCAGCGTC ATTTAATGAC AATCAATACT GATGAAATTG AAAAAATGAT 2 94 0 

TATAGAGACA AAGAGGGCAG AGTTGATTCA TTGGATATCG ATACTTCCAG TCATCATATT 3 000 

CAATAAAGGC CCTCGTTTAG TAAAGTATAT AAATATTTTC TATGCAATGA TAGCTAATGT 3 06 0 

TCCAATCATT ATTGTGCAAC GCTATAATCG ACCGAGATTA ACGCAGTTAC TACGCATATT 312 0 

AAAACGAAGA GGTGAACGTC ATGACTAAAC ATATCATCGT TATTGGTGGT GGCTTAGGTG 318 0 

GGATTTCTGC AGCAATTCGA ATGGCACAAA GTGGCTATTC GGTCTCATTA TATGAACAAA 324 0 

ATAATCATAT AGGAGGCAAA GTGAATCGTC ATGAATCAGA TGGCTTTGGC TTTGATTTAG 33 00 

GTCCATCTAT TTTAACGATG CCTTATATTT TTGAAAAATT ATTCGAATAT AGCAAGAAGC 3 3 60 

AAATGTCAGA CTACGTTACA ATCAAGCGAT TGCCACATCA ATGGCGTAgC TTTTTTCCAG 34 2 0 

ATGGAACGAC TATCGATTTG TATGAAGGTA TTAAAGAAAC AGGTCAGCAT AATGCGATAT 34 80 

TGTCGAAACA GGATATAGAG GAACTGCAAA ATTATTTGAA TTATACAAGA CGAATCGATC 354 0 
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TTCATGGGCC 


ATTAAATGCT 


CTTATTAATT 


ATGATTATGT 


ACATACTATG 


CAACAGGCCA 


3660 


TAGACAAGCG 


TAT CTCGAAT 


CCATACTTGC 


GACAAATGTT 


AGGCTATTTT 


ATCAAATATG 


3720 


TAGGTTCTTC 


ATCATACGAT 


GCGCCAgCTG 


TATTATCTAT 


GTTATTCCAT 


ATGCAACAAG 


3780 


AGCAAGGCCT 


TTGGTATGTA 


GAAGGTGGAA 


TCCATCATTT 


AGCCAATGCC 


TTGGAAAAGc 


3840 


tAGCGCGTGA 


AGAAGGTGTC 


ACAATTCATA 


CAGGTGCACG 


TGTGGACAAT 


ATTAAAACAT 


3900 


ATCAAAGACG 


TGTGACGGGT 


GTCAGATTAG 


ATACAGGTGA 


GTTTGTAAAG 


G CAGATT ATA 


3960 


TTATTTCAAA 


TATGGAAGTC 


ATACCTACTT 


ATAAATATTT 


AATTCACCTT 


GATACTCAAC 


4020 


GATTAAACAA 


ATTAGAGAGG 


GAATTTGAGC 


CGGCAAGCTC 


AGGATATGTG 


ATGCATTTAG 


4080 


GTGTTGCTTG 


CCAATACCCG 


CAATTAGCAC 


ATCATAATTT 


CTTTTTTACG 


GAAAATGCTT 


4140 


ATCTCAATTA 


TcAACAAGTT 


TTTCATGAAA 


AGGTATTGCC 


AGATGATCCG 


ACCATTTATC 


4200 


TAGTAAATAC 


GAATAAAACT 


GATCACACAC 


AAGCGCCAGT 


AGGTTATGAA 


AAT AT CAAAG 


4260 


TCTTACCACA 


TATTCCATAT 


ATTCAAGATC 


AGCCTTTTAC 


CACTGAAGAT 


TATGCGAAGT 


4320 


TTAGGGATAA 


AATTTTGGAT 


AAATTAGAAA 


AAATGGGACT 


TACTGATTTA 


AGAAAACACA 


4380 


TTATTTATGA 


AGATGTTTGG 


ACAC CGGAGg 


ATATTGAAAA 


AAATTATCGT 


TCTAATCGTG 


4440 


GTGCAATATA 


TGGTGTTGTA 


GCAGATAAAA 


AGAAAAACAA 


AGGATTTAAA 


TTTCCTAAAG 


4500 


AAAGTCAGTA 


TTTT GAAAAC 


TTGTACTTTG 


TAGGTGGATC 


AGTAAATCCT 


GGTGGTGGCA 


4560 


TGCCAATGGT 


TACATTAAGT 


GGGCAACAAG 


TCGCAGcAAg 


ATAAACGCGC 


GAGAAGCGAA 


4620 


GAATAGGAAG 


TGATATCTAT 


GAAATGGTTA 


TCACGAATAT 


TAACAGTAAT 


AGTGACCATG 


4680 


TCTATGGCGT 


GTGGTGCaTT 


GATATTTaAT 


CgTAGACATC 


A 




4721 



35 

(2) INFORMATION FOR SEQ ID NO: 235: 

~ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3516 base pairs 

(B) TYPE: nucleic acid 

40 (C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23 5: 

TATTCGTGCG CAATGGGCTA AATTAGGTCT AGGTTTAGAT TATAGTAGAG AACGTTTTAC 6 0 

TTTAGATGAA GGTTTAAGTA AAGCAGTTAA AAAAGTTTTT GTTGATTTAT ACAATAAAGG 12 0 

AATTATTTAT CGTGGCGAAC GTATTATAAA TtGGGATCCn AAAGCACGTA CAGCTTTATC 180 

TGaTATTGAA GTAATACATG AAGATGTTCA AGGTGCGTTT TATCATTTTA AATATCCTTA 24 0 



1010 



EP 0 786 519 A2 





TACAGCGATT 


GTTGTTAACC 


CTAATGACGA 


ACGATACAAA 


GATGTAATCG 


GTAAAACTGT 


360 




TATATTACCA ATCGTAGGAC 


GCGAACTGCC 


TATTTTAGCA 


GATGAGTATG 


TTGATATAGA 


420 


5 


CTTCGGTTCT 


GGTGCTATGA 


AAGTGACACC 


AGCACATGAC 


CCTAATGATT 


TTGAAATTGG 


480 




TCAAAGACAT 


CAATTAGAAA 


ATATTATCGT 


TATGGATGAA 


AATGGTAAAA 


TGAACGACAA 


54 0 




AGCGGGTAAA 


TATGAAGGTA 


TGGACCGTTT 


TGATTGTCGT 


AAACAGCTAG 


TTAAAGATTT 


600 




AAAAGAACAA 


GATTTAGTTA 


TCAAGATTGA 


AGATCATGTT 


CATTCTGTAG 


GTCATTCAGA 


660 




ACGATCTGGC 


GCTGTTGTTG 


AACCATATTT 


ATCAACACAA 


TGGTTTGTGC 


GCATGGAAGA 


720 


75 


CTTAGCGAAA 


CGTT CATTAG 


ATAACCAAAA 


AACAGATGAT 


CGTATTGATT 


TTTATCCGCA 


780 


ACGTTTCGAA 


CATACATTTA 


ACCAATGGAT 


GGAAAATATT 


AGAGATTGGA 


CGATTTCAAG 


840 




ACAATTATGG 


TGGGGTCATC 


AAATTCCGGC 


TTGGTATCAT 


AAAGAAACAG 


GCGAAATATA 


900 


20 


TGTTGGAGAA 


GAAGCGCCAA 


CTGATATTGA 


AAATTGGCAA 


CAAGATGAAG 


ATGTATTAGA 


960 




TACGTGGTTC TCaAGTGCTT TATGGCCtTT CTC y ACGTTA GGTTGGCCTG ATTTAGAAAG 


1020 




TGAAGACTTT AAACGATACT ACCCAACAAA 


TGC CTTAGTT 


ACAGGTTACG 


ATATTATCTT 


1080 


25 


TTTCTGGGTA 


GCACGCATGA 


TATTCCAAGG 


CTTAGAATTT 


ACAGATCGTC 


GTCCATTTAA 


1140 




TGATGTATTA 


TTACACGGTT 


TAGTTCGTGC 


TGAAGACGGG 


CGTAAGATGA 


GTAAATCATT 


1200 




AGGTAATGGT 


GTGGATCCAA 


TGGATGTTAT 


TGA CGAATAC 


GGTGCTGATA 


GCTTGCGTTA 


1260 


30 


CTTCTTAGCA 


A CAGGTTCAT 


CTCCAGGACA 


TGATTTAAGA 


TACTCAACTG 


AAAAAGTTGA 


1320 




GTCAGTGTGG 


AACTTTATCA 


ATAAAATCTG 


GAATGGGGCA 


CGTTTCAGTT 


TAATGAATAT 


1380 




CGGTGAAGAC 


TTTAAAGTTG 


AAGATATCGA 


TTTAAGTGGT 


AACTTAT CAT 


TAGCAGATAA 


1440 


35 


ATGGATTCTA 


ACACGTTTAA 


ATGAAACGAT 


TGCAACAGTT 


ACTGATTTAA 


GTGACAAATA 


1500 




TGAATTCGGC 


GAAGTTGGAC 


GTGCATTATA 


TAATTTCATT 


TGGGATGATT 


TCTGTGATTG 


1560 


40 


GTACATTGAA 


ATGAGTAAAA 


TTCCAATGAA 


TAGTAATGAT 


GAAGAACAAA 


AACAAGTTAC 


1620 


ACGTTCAGTA 


TTGAGTTATA 


CTTTAGACAA 


TATTATGAGA 


ATGCTACATC 


CATTCATGCC 


1680 




ATTTGTAACA 


GAGAAAATAT 


GGCAAAGTTT 


ACCACATGAA 


GGTGACACAA 


TTGTTAAAGC 


1740 


45 


TTCATGGCCA 


GAAGTGCGTG AATCATTGAT 


TTTTGAAGAA AGTAAACAAA 


CAATGCAACA 


1800 




ACTTGTTGAA 


AT CATTAAAT 


CTGTAAGACA 


ATCACGTGTA 


GAAGTAAATA 


CGCCATTGTC 


1860 




TAAAGAAATA 


CCTATTTTAA 


TTCAAGCTAA 


AGATAAAGAA 


ATTGAAACAA 


CTTTATCACA 


1920 


50 


AAACAAAGAT 


TATTTAATCA 


AATTCTGTAA 


TCCTAGTACC 


TTAAATATTA 


gCtGACGTGG 


1980 




AAAwTCCTGA 


GAAAGCAATG ACa T CAGTTG 


TAATTGCAGG TAAAGTGGTA 


TTAC CATTAG 


2040 
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AAAGCGAATT AGATAGAGTA GATAAAAAGC TCTCTAATGA AAACTTTGTA AGTAAAGCAC 216 0 

CTGAAAAGGT TATAAATGAA GAAAAACGTA AAAAACAAGA TTATCAAGAA AAATATGATG 222 0 

5 GTGTGAAGGC AAGAATTGAA CAATTAAAAG CATAGGAGTT AGTAACAATG AATTACCTAG 228 0 

AGAGCTTGTA TTGGATACAC GAAAGAACTA AATTTGGCAT CAAACCAGGT GTTAAACGTA 234 0 

TGGAATGGAT GCTAGCACAA TTTAATAATC CTCAAAATAA CATTAAGGGT ATTCATGTAG 24 0 0 

GTGGCACAAA TGGTAAAGGC TCTACAGTTG CTTACCTTAG AACAGCTTTA GTTGAAAATG 24 6 0 

GTTATGAAGT AGGTACATTT ACGTCGCCGT TTATTGAAAC ATTTAATGAA CGAATTAGTC 2520 

TAAATGGTGT GCCAATATCA AATGACG CT A TTGTAGAATT AGTATCACGT ATTAAACCAG 258 0 

TAAGTGAAAT GATGGAACGT GAAACAGATT TAGGTGTTGC AACTGAATTC GAAATAATCA 264 0 

CAGCGATGAT GTTTTTATAT TTTGGTGAAA TACATCCTGT TGATTTTGTC ATTGTTGAGG 270 0 

20 CTGGATTGGG TATAAAGAAC GATTCGACAA ATGTCTTTAC ACCGGTTTTA TCAATCTTAA 276 0 

CTAGTATCGG TCTAGACCAT ACAGATATTT TAGGTGGTAC TTATCTAGAT ATTGCTAGGG 2820 

ATAAAGGCGC GATTATAAAG CCTAACGTTC CAGTGATATA TGCTGTTAAA AATGAAGATG 2880 

25 CATTAAAATA TGTTCGTGAA CGCGCAATTG AACAACATGC AAAGC CAATT GAATTAGATA 294 0 

GAGAAATTGT TGTTGTATCG CAAAATGATG AATTTACTTA CCGTTATAAA GATTATGAAT 3 00 0 

TAGAAACAAT CATTTTAAGC ATGTTAGGTG AACATCAGAA ACAAAATGCT GCATTAGCCA 3060 

30 

TAACAGCTCT TATTGAATTA AATGAACAAG GATTAATTGA ATTAGATTTC AATAAGATGA 3120 

TAGACGGTAT TGAATCAGTT CGTTGGACTG GACGTATTGA GCAGGTGCAT GACAAACCTT 318 0 

TAATCATTTT GGATGGCGCA CATAATT CAG AGAGTATAGA TGCTCTAATT GATACAATTA 3 24 0 

35 

AACAGTACCA TGATAAAGAA AAAGTAGATA TTTTGTTCTC AGCAATAAAC GGAAAACCGA 3300 

TTAACGAGAT GGTCAAACAT TTAAGTTTAA TTGCGCATAC GTTTTATGCA ACTGAATTTG 33 6 0 

40 ATTTTCCGAA AGCGTTACGC AAAGAAGAAA TTGTAGGTAG TATTGAAAAT GATGAAATAC 3420 

AATTAGTAGA TGACTACGTT GAATTTATAA AAAATTATCA AGGTGATACA TTAGTAATTA 34 8 0 

CCGGTAGTCT GTATTTCATA AGTGAAGTTA AATCAA 3 516 

45 (2) INFORMATION FOR SEQ ID NO: 236: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7481 base pairs 

(B) TYPE: nucleic acid 
50 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



55 
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TGAGTGATAG AATCAAAAAA GCCATCTCAA AAATTAATCA AGCAAACAAC ATTCCAAACA 60 

ATGsTCGCAA ATCACCAATG TATCACTCTC CAATTACGTA ACTATGATTT AATTTAAGCA 120 

5 

TAGTTATTGA GGTTTTGTGA TATATAGTAT AAAATTAATG AGAATTAAAT TTAATAATGT 180 

AAAATTCATm TTCgGGGTCG GGTGTAATTC CCAACCGGCA GTAAATAAAG CCTGCGACCT 24 0 

GCTAGTATGT ATCATATTAG TGGCTGATCT AGTGAGATTC TAGAGCCGAC AGTATAGTCT 300 

10 

GGATGGGAGA AGATGGAGGT TTTTTGTTGT GCAATAATCC TCCTATTCTT ACGAGATGAA 3 60 

TGGAAGGAGA AAATTGAATA TGCAACAAAA TAAACGTCTT ATCACAATAA GTATGTTGAG 4 20 

15 CGCGATTGCG TTTGTGTTAA CTTTTATCAA GTTTCCTATA CCATTTTTGC CACCATACTT 4 80 

AACTTTAGAT TTTAGTGATG TACCGTCACT ACTAGCTACA TTTACGTTTG GACCAGTTGC 54 0 

CGGTATCGTA GTTGCACTGG TTAAAAATTT ATTGAACTAC TTATTTAGTA TGGGCGATCC 60 0 

20 AGTTGGACCA TTTGCTAACT TTTTAGCAGG CGCAAGTTTC TTATTAACTG CTTACGCCAT 660 

CTATAAAAAT AAACGTTCAA CAAAATCTTT GATTACTGGA TTAATCATTG CAACAATCGT 720 

TATGACTATC GTGTTGAGTA TTTTGAACTA TTTCGTTCTA TTACCTTTGT ACGGTATGAT 78 0 

25 ATTTAACTTA GCTGATATCG CAAATAATCT TAAAGTAATC ATTGTTTCAG GAATTATACC 84 0 

ATTCAATATT ATTAAAGGTA TCGTTATTTC TATTGTATTT ATTTTACTAT ATAGAAGGCT 90 0 

TGCGAATTTC TTGAAAAGAA TTTAATCAAA TTAAAGCAAA ATAATATACA CATAATAATA 96 0 

30 

AAAAGCAGGT GACTATCAAT AAACGATAGC TTGCCTGCTT TTTCTATAGA ACATTTGTCT 102 0 

AAAAAATCAA TTATTCaAAT TTTAAAGCGT CCCCATCAAA TGATTCGTCT GCAATTTTAA 108 0 

TAGAATCTGt AGGGCATCCa TCAATTGCAT CTTCCATATC TTCATATAAT TCCt CAGGTA 114 0 

35 

CTTCTGCAGT ACCTTGGTTA TCGTCAAGGA TTACGAAAGC AATACCTTCG TCGTCGTAAT 12 0 0 

CATATATATC TGGCGCTGCT GCACCGcATG CACCACATGC AATACAAGTA TCCATATCAA 12 6 0 

40 CGATTGTATA TTTTGCCAAT GTCTTCGCCT CCTTTGATAA AAATGCTAAA ATAGTAATGT 132 0 

GACTAAAATT TTAGACAGCA T CATTTTT AT TTTCAAATTA TCCGTTTTAC AGAGTGAGGG 13 8 0 

TTAAATTTGC AACACATTAT AAAAACAGCA TTACAACAAA CATTTAACTA TAAAACAAAT 14 4 0 

45 AAAAGTATTT ACAATATCTT AGTTGGTAAG AAATCTCACC AAACCTTTTT TGACGCTTGT 1500 

AGTCAACAAC AGTT GTCATT ATATCACAGT TTACCACTAT TAAAATATCC GTCTTTTGAG 1560 

CTATTTtTAG AAAAAATCAA TGAATTTAAT GCTGAAATGG AAATCATGTT GCATCCTAGA 1620 

50 

TATACATTTG aAAGCATGGG GCAAACATTT CAAGCAATTC AACTATTAGT GCAAaCCATG 1680 

TCTAATACCA AACAACATGT TTTTCATTTT GTACCAATCT CTCAAAATAA TAAGATACAm 174 0 

55 
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AATGAACTAC ATAACTTGTT TAAAGCAATA ACTTTAAAAG GGCCATGTTA CTTACATTAT 186 0 

TATTTGCAAG GCTATGATGA AC CAATGTAT ACGAGACAGC AAGTTAGTTT AATAGAAAAG 192 0 

5 CTATCTCAAC AG CAATTGTT TGAATA CGAA ATGAATAATT TAGTGACAAT GATGTTTGAA 198 0 

TTAGAAAGTG GAGAATATAC TATTTTATCA AAAATAATAA TGAAACCTAC ATTATTAAAT 204 0 

CAAACTTATA TTACTTATAC AAAATTGCTT GAACAATTCA CGATGGAAGA TATAG CGGCT 210 0 

10 

CAACAACAAG TTAAAATCAA TACTAT CGAA GATCATGTAC TTGAAATCTT AATCAAAGGT 2160 

TACATGTCTA ATTACGATGA TTATGTTGAA CTAGAAGATC AACTCCAGTT TTTGAATTTT 2220 

js TATCAACAGC ATCGTGGCGA ACGATTAAAA TTTTACAAAG AACAATTTGA CACGTTATCA 22 80 

TATTTTCAAT TAAAAGTATT AATCGTTGGA TTTGAAAGAG GTGAT CTGAA TGTTGCATGA 234 0 

TATTTTACGA AACAAATTTG GATTCGAGAG TTTTAAACCG GGACAACAGG AAATTATAGA 24 00 

20 AAGTATAATG TCT CAACAAC ACACTCTAGG TATACTTCCA ACTGGAAGTG GAAAGAGTTT 24 60 

GTGTTATCAA ATACCTACGT ATTTATCAGG TAAGC CGACA TTAATTATCT CACCGTTAAT 2520 

ATCTTTAATG GATGACCAAG TTATGCAGTT GAAAATAAAT GGAGAAAAAC GTGTAACATG 2580 

25 TATTCACTCT GGTATGGATG AAATTGAGAA AAAGCATAAT ATTAAATGTT TACGACATAG 264 0 

CCGCTTCATC TTTCTAAGTC CAGAATTTCT CCTGCAACCG TCAAATTTTA AATTAATATC 2700 

TATGATAGAC TTTGGCATGA TTGTTCTAGA TGAAGCACAT TGCCTATCTG AATGGGGATA 2760 

30 

TGATTTCAGA CCACATTATG CTCTAATAGG AAAAGTAACA AAGCATTTTA AAGAAGCGGT 2 82 0 

TGTCTTAGCA TTGACAGCAA CTGCACCACC GCATTTACAA GATGATTTGA CGGAAATGTT 2 880 

AGCGATTCAA TTCAATGTTA TTAAAACTAC AATGAATCGC CCAAATATAA GCTTTAAG CA 2 94 0 

35 

TCTTAATTTT CATGATGATG AAGATAAAAT TGAATGGTTG CTGCCGTTTC TACAACAGTC 3 000 

GGGAGCAACG ATTATTTATG TCTCATCGAA AAAGATGTGT CTGAATTTAG CGCAACTTAT 3 06 0 

40 TTATGATTCA GGTTTTCTTA CAGGTATTTA TCATGGTGAT ATGAATTATC AAGAGCGACA 312 0 

CACAGTTCAA CAACAATTTT TAAATAATGA TATTCCGATT ATAGTCG CAA CGAGTGCTTT 318 0 

TGGTATGGGA ATTAATAAAA AAGATATTCG CACAATCATT CACTTTCATC TTTCAACAAG 3 24 0 

45 TCCTTCTAAC TACATTCAAG AAATTGGCCG TGCGGGTCGC GATGGTGAAC TAAGT CAGGC 3 300 

AATTAGTTTA TTCCAACCGG ACGATAAATA TATTTTAGAA ACGTTATTAT TTGCAGATAT 3 3 60 

GATAACAGAA GAAGATGTAC AAAATTTCGA AATAGGAGAA TTTTTAG CTC CCGATAAACA 3 4 20 

50 AGCCGTTTTG ACAACGTTGc AATCATTCTA TAGTATCGGC GCCTTGaAAC AGATATTTAA 3 4 80 

GCAATCATTT AAACGAAAGC AATTAGGATT CTTTCGCATG ATTGGCTATT GCAAATTGGA 3 54 0 
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ATGTTGTGAC AATGATTCTA ATATAACTGA TATCGCAATT TTAAATAAGA AGAAGGTAAT 3660 

TAGAAGTATT GGATTTGATG AAAAGTTGCA AAATTTATTT CTCAGATAGT ATTACTTTAC 3 72 0 

5 

TAAAAGAAAA TTGACAAGCT ATAATTAGTG TATACACAAT TGAAAAATGA TTGAAATAAT 3 7 80 

TTTGAAAAAT ATACATAAAC ATATGTCATG TGGGTATATT TTATGTAAAA TCATTGTAAT 3 84 0 

AGAATAGAAA GGAAGATGGC TATGTCTAAT AATTTTAAAG ATGACTTTGA AAAAAATCGT 3 9 00 

w 

CAATCGATAG ACACAAATTC ACATCAAGAC CATACGGAAG ATGTTGAAAA AGACCAATCA 3 96 0 

GAATTAGAAC ATCAGGATAC AATAGAGAAT ACGGAGCAAC AGTTTCCGCC AAGAAATGCC 4 020 

, s CAAAGAAGAA AAAGACGCCG TGATTTAGCA ACGAATCATA ATAAACAAGT TCACAATGAA 4 090 

TCACAAACAT CTGAAGACAA TGTTCAAAAT GAGGCTGGCA CAATAGATGA TCGTCAAGTC 414 0 

GAATCATCAC ACAGTACTGA Aa GTCAAGAA CCTAGCCATC AAGACAGTAC ACCTCAACAT 4200 

20 GAAGAGGAAT ATTATAATAA GAATGCTTTT GCAATGGATA AATCACATCC AGAACCAATC 4 260 

GAAGACAATG ATAAACACGA TACTATTAAA AATGCAGAAA ATAACACTGA GCATTCAACA 4320 

GTTTCTGATA AGAGTGAAGC TGAACAATCT CAGCAACCTA AAC CATATTT TACAACAGGT 43 8 0 

25 GCTAAC CAAT CAGAAACATC AAAAAATGAA CATGATAATG ATTCTGTAAA ACAAGATCAA 44 4 0 

GATGAACCTA AAGAACATCA TAATGGTAAA AAAGCAGCAG CTATTGGTGC TGGAACAGCA 450 0 

GGTGTTGCAG GTGCAGCTGG TGCAATGGCT GCTTCTAAAG CTAAGAAACA TTCAAATGAC 4 56 0 

30 

GCTCAAAACA AAAGTAATTC TGGCAAGGCG AATAACTCGA CTGAGGATAA AGCGTCTCAA 4 620 

GATAAGTCTA AAGATCATCA TAATGGCAAA AAAGGTGCAG CGATCGGTGC TGGAACAGCA 4680 

35 GGTTTGGCTG GAGGCGCAgC AAGTAAAAGT GCTTCTGCCG CTTCAAAACC ACATGCCTCT 4 74 0 

AATAATGCAA GCCAAAACCA TGATGAACAT GACAATCATG ACAGAGATAA AGAACGTAAA 4 8 00 

AAAGGTGGCA TGGCCAAAGT ATTGTTACCA TTAATTGCAG CTGTACTAAT TATCGGTGCA 4860 

40 TTAGCGATAT TTGGAGGCAT GGCATTAAAC AATCATAATA ATGG TACAAA AGAAAATAAA 4 920 

ATCGCGAATA CAAATAAAAA TAATGCTGAT GAAAGTAAAG ACAAAGACAC ATCTAAAGAC 4 98 0 

GCTTCTAAAG ATAAATCAAA ATCTACAGAC AGTGATAAAT CAAAAGAGGA TCAAGACAAA 504 0 

45 GCGACTAAAG ATGAATCTGA TAATGATCAA AACAACGCTA ATCAAGCGAA CAATCAAGCA 510 0 

CAAAATAATC AAAATCAACA ACAAGCTAAT CAAAATCAAC AACAGCAACA ACAACGTCAA 516 0 

GGTGGTGGCC AAAGA CAT AC AGTGAATGGT CAAGAAAACT TATACCGTAT CGCAATTCAA 522 0 

50 

TACTACGGTT CAGGTTCACC GGAAAATGTT GAAAAAATTA GACGTGCCAA TGGTTTAAGT 52 8 0 

GGTAACAATA TTAGAAACGG TCAACAAATC GTTATTCCAT AATATAACTA TATAAATTGT 534 0 
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TAAATTGCGC TTATAAGTAT GTAGCGGTTT TTTCATTTTT CAAAGTTTGT TATTTAACAA 54 6 0 

GGTCTTGTCT CGAATATTGG CATATCAATT TAACTTTTTA AATAGTCATC AAAAAGATAA 552 0 

5 AACACCACAA TCAACAAATT TAAC GAGGAA GAATAAAAAA TAAATCAACA TATTAAATTG 558 0 

TAGTGTTATT CAACTCCGTA GCTAACAATT CTCTATTCAC ATTAAACAAA TTGTCAAAAA 564 0 

TATATCATAA ATCTT CAAG C ACAGACTTAG CGCATCAATC ACTGAACTGT TATAATAGTT 570 0 

TGGGATTAAA GGAGG CCGAA ACAATGCAAA AAGTTGAAAG TATCATAATT GGTGGAGGGC 576 0 

CATGCGGATT AAGTGCGGCT ATTGAACAAA AAAGAAAAGG TATTGATACC TTAATTATTG 5820 

AAAAGGGTAA TGTCGTTGAA TCAATCTACA ATTATCCTAC TCACCAAACA TTTTTCTCAT 58 8 0 

IS 

CAAGTGATAA ATTAAGTATT GGGcGAgTAC CGTTTATCGT TGAAGAAAGT AAACCAAGAC 594 0 

GTAATCAAGC GCTAGTTTAT TAC CGAGAAG TTGTAAAACA TCATCAATTA AAAGTAAATG 6000 

2 0 CATTTGAAGA AGTATTAACT GTTAAAAAAA TGAATAATAA ATTTACTATT ACTACGACGA 6060 

AAGATGTTTA TGAATGTCGA TTTTTAACAA TCGCGACAGG CTATTATGGT CAGCATAATA 6120 

CATTAGAAGT TGAAGGTGCG GATTTACCTA AAGTGTTCCA TTATTTTAAA GAGGCACATC 6180 

2S CGTATTTTGA TCAAGATGTT GTAATTATCG GTGGTAAGAA TTCGGCTATC GATGCTGCTT 624 0 

TGGAGTTGGA AAAAGCTGGT GCTAACGTGA CGGTTCTATA TCGTGGTGGA GATTATTCGC 6300 

CTTCAATTAA ACCGTGGATA CTTCCAAATT TCACAGCATT AGTAAATCAT GAAAAAATTG 6360 

30 ACATGGAATT TAATGCTAAT GTTACCCAAA TAACTGAAGA TACTGTGACT TAT GAAGTAA 6420 

ATGGTGAAAG TAAAACGATA CACAATGATT ATGTATTTGC GATGATTGGT TATCATCCCG 64 80 

ATTATGAATT TTTAAAATCT GTAGGCATTC AAATTAATAC AAATGAATTT GGAACAGCGC 6 54 0 

35 

CTATGTATAA TAAAGAAACA TACGAAACAA ATATCGAAAA TTG CTATATT GCAGGTGTAA 66 00 

TTGCTG CAGG GAACGATGCG AAT AC CATTT TTATTGAAAA TGGTAAATTC CACGGGGGCA 6660 

4Q TTATTGCTCA AAGCATGCTA GCTAAGAAAC AAACGCCCTT AGAATCATAA AAATAAAGGT 672 0 

CTATGTACTA AATAACTTAG TTTTACAACG ACTGACATTC ATGATATGTC AAATGAGGTT 678 0 

GATGACTATT GATTGTACAT AGACCTTTTT ATGTTACGTA TTCATTATAA TTCAAAATAT 684 0 

45 GATTTGATTT CAGCTTTATC TAAATTGTTG CTTAACGCGA CTAATAATTT TAATCTTGCT 6900 

TTTGGACCAT TCAAGCCGTT AGAAAAAATA AAACCTTGTT GTGCGAGTTG GTAACCACCA 6 96 0 

CCATCGTATG CGTAAGTTGG ACTCACAATA CCATTAAAGG AACGTGAAAC TAGCACAATA 7 020 

50 GGTATATTTA AAGATACTAA TTGTTGAATG CCTTCTAATG CGCTTGGAGG TATGTTGCCT 7080 

TGTCCTAACG CTTCAATAAC CATACCATCG ATACCTTCTC GACTATAAAA ACTAAAAATG 714 0 
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TCCAATGCTT GTTGGCGATA TGGCATATGA TGGAATTGCA CACGATCCTT TGTCAATACA 



7260 



CCTAGCGGAC CATGATTTGG ACTTTGAAAT GTGTTTGTAT TAGACGTATG TGTTTTGGTA 



7320 



5 



ACATTACGCG CCGTATGAAT TTCATCATTA AaTACAACCA TCACGCCTTT ATGACGGGCC 



7380 



TTTTCATCAG AGGCAACGCG AATAGCGGAA ATATAATTAT ATAATCCGTC AGAACCAATT 



7440 



TCATTAGACG AGCGCATTGG C CAAGAAn TA ACAACAGGTT G 



7481 



(2) INFORMATION FOR SEQ ID NO: 23 7: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6346 base pairs 

(B) TYPE : nucleic acid 

15 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23 7: 

ATGAATTATA CCTTCCACTA GAAGTGTCGG TATTTATGTG CCTGGTGGTA AAG CAAGTTA 60 

TCCTTCAACG GTATTAATGA CAGCGACGTT AGCACAAGTA GCAGGTGTGG AAAATATTGT 12 0 

25 CGTTGTGACA CCACCTCAAC CTAATGGTGT GTCTCAAGAA GTATTAGCAG CATGCTATAT 180 

TACGCAAGTT GATCAAGTAT TTCAAGTTGG TGGTGCTCAA AGTATTGCTG CGTTAACTTA 24 0 

TGGCACAGAA ACGATACCTA AAGTTGATAA GATTGTAGGT CCAGGCAATC AATTTGTTGC 3 00 

30 ATATGCCAAG AAATATTTAT TTGGACAAGT AGGTATTGAC CAAATAGCTG GACCAACAGA 36 0 

AATAGCACTT ATTATTGATG AAACAGCAGA TTTAGATGCC ATCGTATATG ATGTTTTTGC 42 0 

ACAAGCAGAA CATGATGAAT TAGCACGTAC ATATGCCATT AGTGAAGATG CGCAAGTCCT 480 

35 TAAAGATTTA GAATCACGTA TTGCTAAAGC ATTGCCTAAT GTGGACAGAT ACGACATTGT 54 0 

TTCTAAAAGT ATCGCTAATC AACACTACCT TATCCATGCT AGTAATTTTG ATGAAGCATG 600 

CCATGTCATG AATACAATCG CGCCTGAACA TGCGTCGATT CAAACAGTAA ATCCTCAACC 66 0 

ATATATTGAA AAAGTGAAAT ATGTGGGTGC ATTGTTTATT GGACATTATT CGCCAGAGGT 72 0 

CATAGGAGAT TACGTTGCAG GTCCAAGTCA TGTATTACCT ACAAATAGAA CAGCTAGATT 780 

45 TACCAATGGG TTATCGGTCA ATGATTTCTT AACACGGAAC ACGGTCATCC ATTTATCAAA 84 0 

AGATACGTTT GAACAAATTG CTGATTCAGC ACAACATATT GCTCATGTTG AAG CATTATA 90 0 

CAATCACCAG CAGT CTATTT TAATACGTCA GTCTTAGGGG AGTGTAATTG AAATGATTTA 960 

50 TATTGATAAA AATGAAAGTC CAGTTACGCC GTTGGATGAA AAAACAATGA CGTCTATTAT 1020 

TAGTGCAACg CnATATAATT TATATCCTGA TGCAGCATAT GAACAATTCA AGGAAGCTTA 10 8 0 
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GATTCAAAAG TTAATGCTGA TCATGCCAGA AGGTCCGGCA TTAACGC TAA ATCCTGATTT 12 00 

TTTTATGTAT CAAGCATATG CGGCACAAGT AAATCGTGAA ATTGCATTTG TAGATGCAGG 12 6 0 

5 AT CAG ATTTA ACGTTTGATT TGGAAACCAT TTTAACGAAA ATCGATGAAG TACAACCATC 1320 

ATTTTTTATT ATGAGTAATC CACATAACCC TTCAGGCAAG CAATTTGATA CGGCATTTTT 13 80 

AACAGCTATT GCAGATAAGA TGAAAGCATT AAACGGATAC TTTGTCATTG ATGAAGCATA 144 0 

10 

TTTAGATTAT GGTACGGCAT ATGACGTGGA ACTGGCACCA CACATCTTAA GAATGCGTAC 1500 

ATTATCAAAG GCGTTTGGAA TTGCCGGCTT AAGATTAGGT GTCTTAATTA GTACT GCTGG 1560 

AACGATAAAG CATATTCAAA AAATAGAACA TCCATATCCA TTAAATGTAT TTACGCTAAA 1620 

rs 

TATTGCGACT TATATTTTTA GACATAGAGA AGAGACAAGA CAATTTTTAA CGATGCAACG 1680 

ACAGTTAGCT GAGCAGTTAA AACAAATATT TGATACACAT GTTGCAGATA AAATGTCAGT 174 0 

20 GTTCCCATCA AATGCTAATT TTGTACTTAC TAAAGGCTCA GCAGCGCAAC AATTAGGACA 1800 

ATACGTATAT GAACAAGGAT TTAAACCTCG CTTTTATGAT GAGCCGGTGA TGAAGGGCTA 1860 

TGTAAGATAC TCAATTGCAA CAGCATCACA GTTAAAGCAA TTAGAAGAAA TTGTTAAAGA 1920 

25 ATGGAGTGCA AAATATGATT TATCAAAAAC AACGAAACAC AGCTGAAACG CAACTAAATA 1980 

TTTCAATATC TGATGATCAG TCACCATCGC ATATTAATAC AGGTGTGGGC TTTTTAAATC 204 0 

ATATGTTAAC CTTG TTTAC A TTTCATAGCG GTCTGTCATT AAACATTGAG GCACAAGGTG 2100 

30 ATATTGACGT AGATGATCAC CACGTAACTG AAGATATCGG CATTGTCATT GGCCAATTGT 216 0 

TACTTGAAAT GATTAAAGAT AAAAAGCATT TCGTTCGTTA TGGAACGATG TACATTCCAA 2 220 

TGGATGAAAC ATTAGCACGT GTCGTTGTGG ATATAAGTGG GCGCCCATAC CTATCATTCA 22 80 

35 

ATGCATCATT AAGTAAAGAA AAAGTTGGTA CGTTTGATAC GGAGTTAGTA GAAGAATTTT 234 0 

TTAGfAGCGGT CGTAATCAAT GCAAGATTAA CAACGCATAT TGATTTAATT CGTGGAGGTA 24 0 0 

ATACACACCA TGAAATTGAA GCTATATTCA AAGCGTTTTC CCGTGCATTA GGCATAGCGC 24 6 0 

40 

TAACTGCAAC TGATGATCAG CGTGTGCCGT CATCGAAAGG TGTGATTGAA TGATTGTCAT 2 520 

CGTTGATTAT GGATTAGGGA ATATTAGTAA TGTAAAACGC GCTATTGAAC ATTTAGGGTA 258 0 

45 TGAGGTGGTT GTCTCAAATA CCTCAAAAAT AATCGATCAA GCAGAAACAA TCATATTGCC 264 0 

CGGTGTCGGC CATTTTAAAG ATGCGATGTC AGAGATAAAA CGATTAAATC TCAATGCAAT 270 0 

ATTGGCTAAG AATACTGATA AGAAGATGAT TGGTATTTGT TTAGGCATGC AATTAATGTA 276 0 

50 TGAGCATAGT GATGAAGGCG ATGCATCTGG ATTAGGGTTT ATCCCAGGAA ATATTTCGCG 2 82 0 

TATCCAAACA GAATACCCAG TGCCACACTT AGGCTGGAAT AATTTAGTGA GTAAGCACCC 2880 
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AATTG CATAT GCGCAGTATG GGGCTGATAT TCCGGCAATT GTTCAATTTA ACAATTATAT 300 0 

TGGTATTCAA TTCCATCCTG AAAAAAGCGG TACATATGGG TTACAAATTT TGCGTCAGGC 306 0 

5 AATACAAGGG GGATTTATAA ATGATTGAAT TATGGCCAGC GATTGATTTG ATTGGGTCAA 312 0 

CAAGTGTGAG GTTAACAGAG GGTAAATATG ATAGTGAAGA AAAAATGTCA CGCTCGGCTG 3180 

AAGAAAGTAT TGCTTACTAT AGTCAATTTG AATGTGTGAA TCGTATTCAT ATCGTCGACT 3 24 0 

w 

TGATAGGTGC TAAGGCACAG CATGCCCGAG AGTTTGATTA TATTAAGTCA TTGAGGAGAT 33 0 0 

TAACAACCAA AGATATTGAA GTAGGTGGTG GCATTCGTAC GAAGTCACAA ATCATGGACT 3 36 0 

ACTTTGCCGC AGGGATTAAT TATTGCATAG TTGGAACGAA AGGTATTCAA GATACTGATT 342 0 

IS 

GGCTTAAAGA GATGGCACAT ACATTTCCAG GTCGCATTTA TTTAT CTGTT GATGCCTATG 34 8 0 

GAGAAGATAT TAAAGTGAAC GGATGGGAAG AGGACACAGA GTTAAATTTA TTTAGTTTTG 3 54 0 

20 TGAGACGGTT ATCGGATATA CCTCTTGGCG GCATTATATA TACTGATATT GCTAAAGATG 360 0 

GCAAAATGTC CGGACCTAAC TTTGAATTAA CTGGTCAATT AGTAAAGGCA ACGACGATTC 366 0 

CTGTCATTGC TTCCGGTGGT ATTAGACATC AGCAAGATAT TCAACGATTA GCGTCGCTAA 3 72 0 

2S ATGTTCACGC TGCTATTATA GGAAAGGCTG CACATCAAGC ATCTTTTTGG GAGGGGCTAA 3 78 0 

AATGATTAAA AAACGTATCA TTCCATGTTT AGATGTCAAA GATGGTCGTG TCGTTAAAGG 384 0 

GATTCAATTT AAAGGATTAA GGGATATTGG GAATC CTGTT GATTTAGCAA TGTATTACAA 3 900 

30 TGAAGCGGGT GCTGATGAAT TAGTATTTTT AGACATCTCT AAGACGGAAG AGGGTCATAG 3 96 0 

CTTAATGCTA GAAGTGATTG AACAGACAGC GTCACGCTTG TTTATCCCTC TTACTGTAGG 402 0 

GGGTGGGATT CAAAGTCTCG ATGATATTAC CCAATTGCTA AATCATGGTG CAGATAAAGT 4080 

35 

ATCATTAAAT TCAAGTGCTT TAAAAAATCC ACAGCTCATT AAACAAGCGA GTGATAAATT 414 0 

CGGTAGACAA TGCATCTGCA TAGCAATTGA TAGCTATTAT GATCCTGAAA GAAAAGCACA 42 0 0 

TTATTGTTGT ACGACTGGTG GTAAAAAAAT GACAAATATT AAAGTATATG ACTGGGTACA 4 26 0 

40 

GCAAGTAGAA CAGTTAGGTG CAGGTGAGCT CCTCGTTACA AGTATGGGAC ATGATGGTAT 4320 

GAAACAAGGC TTTGATATTG AACACCTAGC AAATATTAAG TCTCTTGTAA ATATTCCAAT 4380 

45 CATTGCTTCT GGTGGTGGTG GCAATGCACA ACACTTTGTA GAATTATTTG ATCAGACGGA 444 0 

TGTTTCTGCA GGTTTAGCTG CAAGTATATT ACATGATCGA GAAACGACGG TTCAATCTAT 4 50 0 

TAAAGAAGTG ATACGG CAAG GGGGTATAGC AGTAAGATGA CCAAATATAA AATTGATTTT 4 56 0 

50 AGCAAAGGTT TAGTGCCAGC AATTTTACAA GATAATCAAA CAAAACAAGT ATTGATGTTG 462 0 

GGTTATATGA ACCAAGAAGC TTTTGATAAA ACGATAGAAG ATGGTGTGGT ATGTTTCTAT 468 0 
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AAAGATATTC ATGTAGATTG CGACAATGAC ACTATTTTAA TTGATGTCAT AC CAAATGG A 4 8 00 

CCAACATGTC ATACAGGCAG TCAAAGTTGT TTCAACACAG AAGTTCCATT TTCAGTGCAA 4 8 60 

5 ACATTAGCGC AGACAGTTCA AGATAGTGCC CAATC CAATA ATGAAAAGTC ATATACAAAA 4 920 

TATTTATTAA CAGAAGGTAT AGAAAAGATT ACAAAAAAAT ACGGTGAAGA AGCTTTTGAA 4 980 

GTCGTAATTG AAGCAATTAA AGGTGACAAA AAAGCATTTG TAAGTGAAGT AGCAGATGAA 504 0 

W 

CTTTATCATT TATTTGTCTT GATGCATGCG CTTGGCGTCG ATTTTTCAGA AATTGAGGCG 510 0 

GAATTAGCGC GTAGACATCA TAAGCGCAAT AACTTTAAAG GTGAACGACA AAATATCGAA 516 0 

CAGTGGTAAA GCAAGTATGG ACTAAGATAT AAGGAAAAGG ATCATGGCTT ATACACTTAC 522 0 

15 

AAATATTGTG GAAAACGTGA CATTTTCAAG TTTAAAATAC GACACCAACA TATTTTAACT 52 8 0 

ATGAATGCTG TGATGGTACT AAAGTTGCGA ACTCGTTATA GATAAGTAGT GGATAATCAC 534 0 

2Q AATACGAAAT CAAAAATAAT TATAAAAAGT AAATTGAGCA ACTCAGGAAT AGATGTCACT 540 0 

GTTAAAGATG TCGAAAAGTA TATGAATCGA TATAATGAAG TTATGAAGGG AAAAAATGGC 54 6 0 

GAAAAAGCTA AAGAGTTATG TTTGTCGTTA CTACCTATTA ATATCATAGT TGTCTTTACA 5 52 0 

25 TTCTTTGTAT TTATACTATA AATACAAATA TATCTAGCCT GAAATAGAAA TGTCATAGCC 5 58 0 

TATTTAAAAG ACAATCTCCA TTAGAACTAA GATATGCATC CCGAAAGTTA GACTAAAAAA 564 0 

CTAACTTTAT GGGATGTATT TTTATGCTAA TCATCATAAA TTCGAGATTA AGTTAAAGGT 5700 

30 AGTTCAAGAG TAATTAAACA ATAAATwAAA AATAGTAGGA TACTTACTTT GAGGGAAGAA 5760 

AATTAACTGT ATATATTTAG TTTAGGAACA AGTATTACGG TTTATCCTGA TACAATTATT 5 82 0 

GTGGATGGGA TGATATTTTT AGGTTTAAAA TACGACACCA GCAAACATAA TAACTGTAAT 5 88 0 

35 

AGCTCATAAA TCTCCCCATA TAG CTAATCT AAAAAAATAA TACATCATTG GAATTAAGCC 5940 

CCAA9CATGT AAATATTAAA AATCAAAAmA GATATmTGTA AAAaAGTTAC AATTtGCATA 6 000 

ATTAAATTGT GTCTAATTAT TGACTAATTA AATTTTGCCA AATATAATAT TAATTAATAA 606 0 

TTTGaAATGA TT AG CGTATA CACTTTAAAT TCTCTTTGGA GAATATATTT TTTAAATACA 6120 

AATGTAAACG CTTTCTCGTC AAATTAAACA ATAGAAAGGA TGGTCATTAT GAGTGCTTGG 6180 

45 TTAAGTAAAT TATTTGAGTT TATTCCTCGA ATAATTATCA ATTTGTTTAT CTAAAATAAA 6 24 0 

AAAATAGAGG TGCTGACAAT GATGAAAAGT CAAAATAAGT ATAGTATTCG TAAATTTAGT 6 3 00 

GTAGGTGCAT CTTCCATTTT AATAGCTACA TTACTATTTT TAAGTG 6346 

SO (2) INFORMATION FOR SEQ ID NO: 238: 

(i) SEQUENCE CHARACTERISTICS : 

<A) LENGTH: 3 775 base pairs 

55 
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(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

5 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 238: 

TGATAATGAT TCTCATTGTC ATACATCACG AAGGAGGCTA ATTAGTCAAT GAATAAAGTA 60 

w ATTAAAATGC TTGTTGTTAC GCTTGCTTTC CTACTTGTTT TAGCAGGATG TAGTGGGAAT 120 

TCAAATAAAC AATCATCTGA TAACAAAGAT AAGGAAACAA CTTCAATTAA ACATGCAATG 180 

GGtACAACTG AAATTAAAGG GAAACCAAAG CGTGTTGTTA CGCTATATCA AGGTGCCACT 240 

15 GACGTCGCTG TATCTTTAGG TGTTAAACCT GTAGGTGCTG TAGAATCATG GACACAAAAA 3 00 

CCGAAATTCG AATACATAAA AAATGATTTA AAAGATACTA AGATTGTAGG TCAAGAACCT 3 60 

GCACCTAACT TAGAGGAAAT CTCTAAATTA AAACCGGACT TAATTGTCGC GTCAAAAGTT 420 

20 AGAAATGAAA AAGTTTACGA TCAATTATCT AAAATCGCAC CAACAGTTTC TACTGATACA 4 80 

GTTTTCAAAT TCAAAGATAC AACTAAGTTA ATGGGGAAAG CTTTAGGGAA AGAAAAAGAA 54 0 

GCTGAAGATT TACTTAAAAA GTACGATGAT AAAGTAGCTG CATTCCAAAA AGATGCAAAA 6 00 

25 

GCAAAGTATA AAGATGCATG GCCATTGAAA GCTTCAGTTG TTAACTTCCG TGCTGATCAT 66 0 

ACAAGAATTT ATGCTGGTGG ATATGCTGGT GAAATCTTAA ATGATTT A GG ATTCAAACGT 72 0 

AATAAAGACT TACAAAAACA AGTTGATAAT GGTAAAGATA TTATCCAACT TACATCTAAA 780 

30 

GAAAG CATTC CATTAATGAA CGCTGATCAT ATTTTTGTAG TAAAATCAGA TCCAAATGCG 84 0 

AAAGATGCTG CATTAGTTAA AAAGACTGAA AGCGAATGGA CTTCAAGTAA AGAGTGGAAA 90 0 

35 AATTTAGACG CaGTTAAAAA CAA CCAAGTA TCTGATGATT TAGATGAAAT CACTTGGAAC 960 

TTAGCTGGCG GATATAAATC TTCATTAAAA CTTATTGACG ATTTATATGA AAAGTTAAAT 102 0 

ATTGAAAAAC AATCAAAATA ATTAAGGAGT TTTACGATGC TACTTAAACC AAAATACCAA 1080 

40 AT CGTTATTG CTGGTTTATG TCTTGCAATA GTAGCTATCT TAAGTTTAAT GATTGGAAAT 114 0 

ACGCTTGTGT CACCAGGTAC GGTGATACAG GCGTTATTCA ACTTTGATAG TGAAAACGAT 1200 

TTACATGATG TTGTCACTGG TGCACGGGCG T CG AGAACAA TCATTG CGTT ATTGACTGGT 126 0 

45 GCTGCCCTTG CTGT CTCAGG TTTGTTGATG CAAGCACTTA CACGAAACCC AATAGCCTCA 132 0 

CCAGGGCTTT TCGGTGTCAA TGCAGG CGCA GTATTTTTTG TCATTTTTAG TATTACATTT 13 8 0 

ATCCAAATTC AATCTTTTAA AATGATTGTA GTTATTGCAT TTTTGGGGGC TATTGTTGTT 144 0 

50 

ACTGTATTAG TTGTTGCACT AGGTATGTTT AGACAAACAC TATTCTCACC TCACCGTGTC 1500 

ATTTTGGCAG GTGCTGCGAT TGCGATGCTA TTTACAGCCT TTACTCAAGG CATACTTATT 156 0 
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AATATTTGGG ATATCCCATG GATTATTCCG CTTGTATTGA TACTTATTTT AATTGCATTT 16 8 0 

AGCATGGCTG CACACATCAA CATCTTGATG ACAAGTGACG ACATTGCAAC CGGCCTCGGT 174 0 

CAAAACATAA AATTAATCAA ATGGATGATT ATTATG CTCA TCAGTATGTT AGCCGGTATT 180 0 

TCGGTAGCCG TAGCTGGATC AATCGTCTTT GTGGGT CTTA TCGTACCGAA TATTAGCAAA 186 0 

CGATTATTAC CACCAAACTA TAAGTATTTA ATTCCTTTTA CTGCATTAGC TGGAGCAATC 1920 

CTAATGATCA TTTCAGACAT TGTTGCTCGT ATAATAATTA AGCCACTAGA GTTGCCTATC 198 0 

GGTGTCGTTA CCGCTGTCAT TGGCGCTATT GTCTTAATCT ATATTATGAA GAAAGGACGT 204 0 

CAACGCTTAT GACCGAAAAG ATTAATAAAA AAGACAATTA CCATCTCATC TTCGCGTTAA 2100 

TCTTTTTAGC CAT CGTTTCA GTGGTAAGTA TGATGATTGG TTCAAGCTTT ATACCATTAC 2160 

AACGCGTACT GATGTACTTT ATAAATCCAA ATGACAGTAT GGATCAATTC ACTTTAGAAG 2220 

TATTACGCTT ACCTCGCATT ACACTTGCGA TTTTAGCAGG TGCCGCACTA GGAATGAGTG 2280 

GTTTAATGTT GCAAAATGTA TTAAAAAATC CAATTGCCTC ACCTGATATT ATCGGTATCA 234 0 

CAGGTGGTGC TAG CTT AAGT GCTGTTGTCT TTATTGCATT TTTCAGCCAT TTAACAATAC 2400 

ATTTACTTCC ACTATTTGCA GTATTAGGTG GCGCAGTTGC AATGATGATA CTATTAGTGT 2460 

TTCAAACGAA AGGACAAATA CGCCCGACAA CACTCATAAT CATCGGTATT TCGATGCAAA 252 0 

CGTTGTTTAT TGCGCTTGTC CAAGGATTAC TCATTACAAC GAAG CAATTA TCTGCTGCCA 2 580 

AAGCTTATAC ATGGCTAGTC GGAAGTCTTT ACGGTGCTAC GTTTAAAGAT ACAATCATTT 2 640 

TGGGTATGGT TATTTT AG CT GTTGTGCCGT TGTTATTTCT TGTTATACCA AAAATGAAAA 2 700 

TATCTATACT TGATGACCCT GTAGCGATTG GCTTAGGCTT ACATGTACAA CGTATGAAAC 2760 

TAATCCAATT AATCACTTCT ACTATACTCG TATCTATGGC AATCAGTTTA GTAGGTAACA 2 82 0 

TTGG6TTTGT CGGTTTAATC GCACCACATA TCG CGAAAAC AATCGTTCGC GGAAGTTATG 2 880 

CTAAAAAGTT ACTAATGTCA GCAATGATTG GTGCCATATC AATTGTTATT GCAGACTTAA 2 54 0 

TTGGG CGTAC CTTATTCTTG CCTAAAGAAG TGCCAGCAGG TGTATTTATT GCTGCTTTTG 3 0 00 

GTGCCCCATT CTTCATATAC TTATTATTAA CCGTGAAAAA GTTATAACGA TATTATTAAA 3 060 

ACAAAATGAC CTCACAACGA AGTTAGCTAA ATGATT CAGT TAACTAACCG TTG CGAGGTT 312 0 

TTTTTATACA TATAGTTGTT GTTATTGTTA ACAAGCGTCG ACTTTCTTAA TTACATATTA 3180 

ATACTTTATA TACAAATAAC ACCGACTCAT ATTCTATAAT ATCAATCAAT ATTCTTCGAT 3 24 0 

TTTTCAAATA TCGATAACTA TTTCTTATTT AAATATAGTG TTTGATAATG TCATTTATTC 3 300 

AAAAACACAA ATTTTAATAA AAATATCATA TTATTTTTAA TTGTAAATTA TGGATTATTT 3 36 0 
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ATATAATAAC CATGACAAAA TTAGAGATTT TATAATCATT G AAG CAT AT A TGtnTCGTTT 34 80 

TAAGAAAAAA GTCAAGCCTG AAGTCGATAT GACTATAAAA GAATTTATAT TACTGACTTA 354 0 

TTTATTTCAT CAGCAAGAAA ACACACTTCC ATTTAAGAAG ATTGTTTCAG ATTTATGTTA 3600 

TAAACAATCG GATTTAGTAC AGCATATAAA AGTACTTGTG AAACATTCAT ATATTAGTAA 3 660 

AGTTCGAAGT AAAATTGATG AGCGTAATAC TTACATTTCA ATATCTGAAG AACAACnAGA 3 720 

nAAAATTGCA GAACnTGTTA CATTGTTTGA TCAAATCATT AAACAATTTA ACCTT 37 75 
(2) INFORMATION FOR SEQ ID NO: 2 39: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1361 base pairs 

(B ) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 239: 

AGAAAAATTA GCCTACCTAT GCAAGTTGTT ATTGCATTAG TGTTAGGTGT TGTCGTAGGA 60 

CTTTTATTAT ATGGACAAGA AAACGTAGCA AATTACATTA AACCATTTGG TGACGTATTT 12 0 

TTAAATTTAA TTAAAATGAT CGTTATACCA GTTGTATTTT GCTCACTAGC GCTTTCTATT 180 

TCGAACGTTG GGGAATCGAA AACTGTAGGG CGTTATGGCT GGaAAACAAT TTTATACTTT 240 

GAAATTATTA CAACAATCGC AATAGGTTTA GGGATTATCT TCGGTAACCT ATTTAAACCA 3 00 

GGTGCTGGAT TAGACCCAAC AAAATTACCT AAAGGTGATA TTTCTAAATA TCAATCAACT 36 0 

GCACATGCAG CAGAACAATC TACATATGGa AATCATTTTA TTGATACCAT TGTACATATT 4 20 

ATTCCGACAA ACTTTTTTGA AGCTTTAAAT AAGGGTGAAT TATTACCTAT TATCTTCTTC 480 

GCAGTATTCT TTGGATTAGG ATTAGCTGCT GTAGGTAAAA AAGCAGAACC AGTTAAAGAA 540 

TTTTTAAGCG GATCGCTTGA AGCTGTGTTC TGGATGATTA ATAAAATTTT AAAATTAGCA 600 

CCACTTGGAG TGTTTGCATT CATTTGTACT ACAATTATTA CATTTGGTGC ATCCGCATTA 660 

TTACCACTAT TAAAATTAGT ATTAGTTGTT GTCTTTGCAA TGGTGTTCTT TGTATTCGCT 72 0 

ATACTAGGAC TAGTTGCATG GATGTGTGGT ATTAATATCA TGAATATTAT TAGAATCTTG 780 

AAAAGTGAAT TGCTTTTAGC ATTTTCTACA TCAAGTTCGG AAG CTGTACT TCCTGTAATG 840 

ATGAAGAAAA TGGAAAACTT CGGTTCTCCA AAAGAAATTA CTTCTTTTGT TATACCAATT 900 

GGTTATACGT TTAACTTAGA TGGATCAGCA CTTTATCAAT CTATTGCAGC ATTATT CGTT 960 

G CACAGATGT ATGGAATGCA CTTAACATTA TCAGAGCAAA TTGTG TTGAT GTTAACATTA 1020 
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ACATTAGGTG CCATGGGCTT ACCGGCACAA GGTTTAGCAT TAATTATTGG TGTTGACCGT 114 0 

ATCTTAGATA TGGTACGTAC ATGTGTAAAC GTTATTGGTA ATGCATTATC AACAATCGTT 1200 

AT AG CTAAAT GGGAAAACGT ATATGACAAA GCAAAAGGTC AAGAATATTT AAAATCAATT 1260 

TAAAAAATAC TATCTGACAT TTAArGnCCC TTACAACCTT TGGTTgTnAG GGCTnTTTTA 1320 

TGTCATGCGT CTTAAAGCCA GGCCGTATAn CGGTAAGCGT A 1361 



(2) INFORMATION FOR SEQ ID NO: 240: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1489 base pairs 

(B) TYPE: nucleic acid 

IS (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

^ (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 240: 

TCAATATGTA AATCGGCGAT TGTCCCTATC t TCATACCCT TACCTTCTTT ACTCAAATTA 60 

AAATGTTATT TATTATGCCA TaGCTTATCT AATATATATA GTTAACTGCT TCATTTAGAT 120 

2S GATTATTTTA TATTTTTGCA TAAAAACTTA TATCTTTTCA AAAAAATCGA TAAGTTTTAG 180 

TTATCATACC CTTACCTATC AAATGTTTTT TCTTATATTT AAAAAAATAA TTGCTTTATT 240 

AAATGGATTT CTTTAGTATT TATAATTAAG AAAACG CTTA CACACAACTT TTTTATTTGC 3 00 

30 TTTATCCTGA GGAGGAAAAT TATGGCAAGA AAATTGCATA GAGAGTTGAA TAACAGACAC 360 

ATCCAATTAA TAGCAATTGG GGGCGCAATT GGAACTGGGT TATTCCTAGG ATCAGGTCAA 4 20 

ACAATATCTT TAACTGGTCC ATCACTGTTA TTCACATACA TGATTATTGG GGTTGTACTA 4 80 

35 TTCGCTTTTA TGCGCGCATT AGGCGAATTG TTGTTGAGCA ATACAAGATT TAATTCATTT 54 0 

GTTGATATTG CAAATGAATA TTTAGGCCCT TTTGGTGGCT TTGTCATTGG CTGGACTTAC 6 00 

TGGTTATGTT GGATTGTATC AAGTATGTCA GACCTAACTG CGATGGGACA ATACTTTGCA 660 

40 

TTTTGGTATC CACAAGTCCC AAATTGGATT ACCGTGCTAT TTATTGTTTT AATCTTGATT 720 

AGCTTCAACT TATTAGGTGC CAGATTATTT GGTGAACTGG AGTTTTGGTT CTCGATTATT 7 80 

AAAGTTGTCA CAATTATTGC GATGGTTATC GTTGGTCTTG TATTAATCTT TTTCTCATTT 84 0 

45 

AAAACACATT ATGGACATGC ATCATTCACA AACTTAATCA GTCACGGTGG CATGTTCCCT 900 

GGTGGAa CAT TTGGTTTCTT AATGTCATTC CAAATTGCTG TATATTCATT CATTGGTATT 96 0 

50 GAACTTATAG GTGTAa CTGC TGGTGAAaCG AAAGATC CTG AAAAAACCTT ACCGAAAGCA 1020 

ATTAATAATG TACCTAT CCG TATTTTATTA TTCTATATCG GTGGTCTATT AGTAATTATG 108 0 

55 
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TTAATCGGCG TACCATTTGC AGCAGGTGTC GTTAACTTTG TCGTGCTAAC TGCCGCGGCC 12 00 

TCTGCTACAA ATAGTGGTAT CTATTCGAAT AGTCGTATCT TATTCGGACT GTCACAACAA 12 60 

5 GGGTTAGGTC CTAAAGTTTT AAATAAAACG AATAGTCATG GCGTGCCTTA TTTATCAATG 1320 

TTAGTTTCAT CAATTGCATT ACTTATAGCA GCCTTGTTAA ACTACATTTT CCCTAATGCA 13 80 

ATTCAACTAT TCATATACGT TACAACGTTA t CAACTGTGT TGTTTTTAGT TGTtTGGGCA 14 4 0 

W ATGATnATTG TCGCTTATCn AATGTATTTG GAAAAAGCAT CCTGAGGCA 14 8 9 

(2) INFORMATION FOR SEQ ID NO: 241: 

(i) SEQUENCE CHARACTERISTICS: 
/s (A) LENGTH: 5000 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 241: 



TTTTCCATCA TrATcACCAT 


TTAAGACAAT 


AGCTGTATGA CCATATCCTC 


CACCAAATCT 


60 


2S TCCACTAAAA ACCACTAAGT 


CCCCAGGTTC 


AG CTTTGAAA GTTGGTGTGT 


TGTGATAAAT 


120 


TTTAGCTTCA CTATTAAAAT 


TATTTGCATA 


TGGTATATCT TTAGCTCCAT 


ATCCTTTt AA 


180 


TCCAkGACCA TAAAGAkGAT 


TCCAATATAC 


ATTAACTAAA TCGAAACATT 


GCCATCCATA 


240 


30 ACTACCGTCG AAATCCCATC 


CTCTATTCTC 


TAATGTTTTC AAATAATTTA 


ATGTACTGCT 


300 


ATTACTATTA CTTTTATTAT 


TTGAAGACAC 


TGTTTTTGGT TTTGGTTCTA 


CTAATGGTGT 


360 


CATTGGCACT TTTAATTTTT 


GAC CAATAAA 


TATTAAATTA GGATTTGCTA 


TATTATTTGT 


420 


35 ATTTTGAATA TTTGAAACTG 


TAGTTTTGTA 


TTTTAATGCT ATAG CA CT AA 


GTGTGTCTCC 


480 


TTTTT5TACA GTATAGATTT 


GTGTTTTTGG 


AGCTTCTCTA AAACTGTAGT 


AACCAAAGTA 


540 


ATTATTAGTA ACTTTATTCG 


TTTTCTTCTG 


ATTAGAATTT TGAGCTTCCA 


AGTTTGCAAT 


600 


TTTAATTTCT TTAGTAAGTT 


CATTGTTATT 


AATAACTAGA TTGTTACCTT 


GGCTTGAGTT 


660 


TTTCGGAGTA TTTGAAATCT 


TTATATCTTG ATTAATTTCA TTTCCGTTTG AAATTGCTGA 


720 


TTTGTTGTCT AACTTTAAAC 


TTGTGTCCGA 


TGTTTTAACA GCACCTTCAT 


TTTTTATTTT 


780 


GTCTTTTGTC GTATTTTTAT 


TAG CATTT AA 


CTCTGATTTC GCGAATACAT 


TTTGCTCATA 


840 


CCCTCTTGTA AAATCTTTAG 


ATTTATCAAT 


TTCATCTGCA TATG CTTTGT 


TCGACATACC 


900 


50 CAATGCCAAA AACATACCTA 


TTGAAATTGA 


CAAAATTCCA ATACTAACTT 


TTCTAATTGA 


960 


ATAG CGTACT TTACTTTGTT 


GTTTATTCAT 


GATGAAACAC TCCTTACAAT AATATACAAA 
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GTAGGAGGTA AAATAATTAA CTTGTCTTTC CAAAATATGA AAAGTGTACT AAAaTTCATC 114 0 

GCACGACAAA TAGCCCATTT CCGATACTTT TATAAAGTAT GGAaTGGGCT ATAGCCATTT 12 0 0 

s AT AT CAT CTT TTAACTTTAT TTATTAACAG TTAATAATGA TTCATAAATA CCTGCTTCTT 12 6 0 

TAG CAGCTTC AATTAATGTT GAACCAATTT CTGAAGGTGT TGCCGCTGTT TTCACACCAC 1320 

AACTATTTAA TGTTTTAATT TTCTCTTCAG CAGTACCTTT ACCACCTGAA ATGATTGCAC 13 80 

W 

CAGCATGTCC CATACGTTTT CCAGGAGGTG CTGTTTGTCC ACCGATAAAG CCTACAACTG 144 0 

GTTTTGTCAT ATTCGCTTTA ATCCATTCAG CTGCTTCTTC TTCAGCCGTA CCACCGATTT 15 00 

CACCAATCAT AACAACTGCT TTCGTTTCGT CATCTTCATT GAATGCTTTT AAAACATCAA 156 0 

15 

TAAAGTTTGT TCCGTTGACT GGGTCTCCAC CAATACCAAC AGCTGTAGTT TGACCAATAC 1620 

CTTCTTCAGT CAATTGGTGC ACTGCTTCAT ATGTTAATGT ACCTGAACGA GATACTACAC 168 0 

20 CAACATGACC TTTTTTGTGA ATATAG CCAG GCATAATACC AATTTTACAT TCATCTGCTG 174 0 

TAATCACACC TGGACAGTTC GGACCAACTA AACGTGTTTT TCTACCTTGT AAGTAG CGTT 1800 

TAACTTTAAC CATGTCTAAT ACAGGAATAT GTTCAGTGAT ACAAATAACC ATATCTAAGT 1860 

2s CTGCATCAGC TGCTTCTAAA ATTGAGTCTG CAGCAAATGG TGCTGGAACG TAAATGACTG 192 0 

AAACCGTTGC CCCAGTTTCA TTTTTAGCTT CTTCAACAGT GTTGAAAACA GGAACGCCTT 1980 

CAACAACTTG ACCACCTTTA CCAGGCGTCA CACCTGCTAC TATTTTCGTA CCATAATCAA 204 0 

30 GCATTTGTTT TGTATGGAAA AGGGCAGTAG ACCCTGTAAT ACCTTGTACC ATTACTTTAG 2100 

TATTCTTATC TATAAATACA CTCATCTTAG TGCTCCCATC CTTTCCTTAT GCTTCTTTGA 216 0 

CTAGTTTAAC AATTTTTTGT GCACCTTCAG CCATTGTTGC TGCTGGTTGA ATTGCTAATC 222 0 

35 CTGAGTCTTT TAAGATTTTT TTACCTAACT CAACATTTGT ACCTTCTAGG CGTACAACTA 22 80 

GTGGTAAAGT TAAATCTACT TCTTTTACAG CTTCAACGAT ACCTTCTGCG ATAACATCAC 2 340 

ATTTCATAAT GCCACCGAAA ATGTTTACAA AAATACCTTT AACATTTTCA TCACCTAAAA 24 00 

40 

TGATTTTAAA TGCTTCAGTT ACTTTTTCTC TAGTAGCGCT TCCGCCTGCA TCTAAGAAAT 24 60 

TGGCTGGGTT T CCA CCGAAA TGATTAATCG TAT CCATTGT TGCCATGGCT AAACCTGCAC 2520 

CATTAACCAT ACATCCGATG TCACCATCTA ATGCAATGTA TGATAAATCA TGTTTAGACG 25 8 0 

45 

CTTCAATCTC TTTCGGATCT TCTTCTTCTA AATCACGTAA TTCTACAACA TCTTTATGTC 2 64 0 

TGAATAATGC ATTATCATCA AAATTAATTT TAGCATCTAA TGCCAATACA TCACCATCAG 2 7 00 

50 CTGTTGTAAC TAATGGGTTG ATTTCTACGA TTGAACAATC TTTTTCAATG AATACATTAT 2 760 

AAAGTGCTAA TAAGAATTTA GCAGCTTTGT TAACAGATTC TTTAGGAATA TTAATATTAA 2 82 0 



55 
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AGATCTTTTC AGGAGTCTTC GCAGCAACTT CTTCAATCTC AGTGCCCCCT TCTTCAGACG 2 94 0 

CCATCAATGT TACTTGGTCA GTCGCACGAT CAATAACGAA TCCAACGTAA TATTCTTTTT 3 000 

5 GAATAGCACA ACCTTCTTCG ATATATAAAC GCTTAATTTC TTTACCTTCT GGACCAGTTT 3 06 0 

GATGTGTCAC CAAAGTTTTC CCTAATAATT CTTTTGCATA TGTTTCTACC TCAGATAAAG 3120 

ATTTAG CAAT TTTTACTCCG CCTGCTTTAC CTCTACCTCC AGCATGAATT TGTGCTTTTA 3180 

'° CAACATAAAC ATCAGAATTT AATTCTTTTG CTTTCTCCAC CGCTTCTTCA GCAGTAAATG 324 0 

CTACTCGTCC TTCTGGAACT GCAACGCCCA TTGAACGAAA TATTTCTTTA CCTTGATACT 3300 

CGTGGATATT CATCTTCCAT CCTCCTGTTA CTTAGGTTAA GTTCCCTTAC AATTATAAAA 33 60 

15 

AATGTAAGCG CTATTGTAAA CTTAAATGCT ACTTTTTTAT CATTTAATTG AATTTTACGA 3 4 20 

TTTACAGTAA CGATTTTATA GGTTCAAAGC TTTTT CTATG CTCTTTCATA ATGCCAATAT 34 8 0 

^ CATCGATTGC TAGTAAATGT TGTTTGGTAC CGTAACCCGC GTTTTTTTCA AAACCATATT 3 54 0 

CAGGATAATC TTTAGATAAC TGTGTCATAT AATCATCACG AAAAACCTTT GCCATGATAC 36 00 

TTGCAGCTGC AATGGACACA CTTCTTGCAT CACCCTTGAT TAAAGATACT TGAGGCAGTG 3660 

2S CATTATCAAG CGTCATCGCG TCTATCAATA AATGCGTTGG TTGTACTGAT AATCCATCAA 3 72 0 

TAGCTCGCTG CATGGCGATT TGAGTAGCTT TATAAATATT AAATTCATCT ATTTCTTnCA 3 7 80 

GtGTCGCGAT CCCATATGCA AAAGCAGTAA CTTCATTTTT TAGTGCTTCA TTTAATTCTA 3 84 0 

30 GACGTTTCGT AACAGGTACT TTTTT CGAGT CATCAAGGCC CAAATAATTG TGATTTGAAT 3 90 0 

TTAAAATTGT TGCGCATGCA ACGACTGGAC CTGCTAAAGG TCCTCTTCCA ACTTCATCAA 3 960 

TCC CACAAAT AATAG CATTA GGATGCTCTT TTAATATTTC ATTTTCAAAG TAAGTCATTT 4 02 0 

55 CAACATACTT TTCTTTTAAA GCTTGTTCTT TTTCTAACGC TTTTCTGCGC CTAG CTATGG 4 08 0 

CATTTTGAAC ACCTTTTCGC TCATCTAAAA AGCATTCATG ATTTTCTAAT TCTTCTATTG 414 0 

TATTAAC CGC ATTAATCAAC TGCGTAACTT CTTTAATTGT TAGCGTCATT TGCTAATTCC 4200 

40 

TCAGTCATAT CTTTAAAAAT ATCAAAACAA TAATTT CCTA TTTTAGCATT TCGAATATCA 4 260 

TAAATAATCA GTTCAATGAC TGCTTCGTAA TCAATTTCAT TACCACGTCG AATTAAGCCc 4 320 

ACGTTTTTTC CCTATCGCAT CAAACCACGC TATGATTTCT GCAtCTTCAG GAACTTCAAT 438 0 

45 

ATTATAATGT GACTTTAATC GCGCTAAATC ATTTTGAATT AAAAAGTTTA ATCCATAGAT 4 44 0 

GGCAACTTCA TCTAAGTGCA CAATACTATC TTTTAT CGCA CCAGTTAAAC TCAACTTCTT 4500 

Sfl ACCGACTTCT TCATCTTCAA ATTTAGGCCA AAGTATCCCT GGTGTGTCTA ATAGTTGTAA 4 560 

TGCATTACCA ACTTTAATCC ATTGTTGTTG TTTGGTCACA CCTGGTTTAT TACCAGT CTG 4 62 0 
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AACGATCATT GCTCTTATCG CTCTAGGTTT AAGTCCTTTC GCTTTTTCGC GTTCAAATTT 4 74 0 

TTCAGCAGTC GCCTTAATTG CTGCAGCTTC CACTTTCTTT AAATTTTTAC CGTGCTTAGC 4 80 0 

ATCCACTGAT ACAGGATAgT At CCTTTATC AATAAAAAAT t GTT CCCATT TTGACATCTC 486 0 

ATTTAAATTA G ACATAT CTT TTTTATTTAA TATAACAACA CGTGGTTTTT GGTTAATAAC 4 92 0 

TTCATCTATC ATAGGGTTTC TTGAACTATA TGGAATTCTT GCATCTACTA GTTCAAACAC 4 980 

TACATCTACT TTTTTTAATT 500 0 
(2) INFORMATION FOR SEQ ID NO: 242: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1700 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24 2: 





AACCCGnAGA 


CGAAACTnCA TAGTTGCCTG TTATGTTGAT 


TAGTGCGTTT 


GTAGCTATTT 


60 


25 


nAAATCAAAC 


ATTATTAAAT ACAGCGTTaC CTAGTATAAT 


GAGAGAATTA 


AATATCAATG 


120 




AAAGTACATC 


GCAATGGCTA GTTACTGGGT TTATGCTTGT 


TAATGGCGTC ATGATACCTC 


180 




TGACGGCATA 


TCTAATGGAT AGAATTAAAA CTAGACCTTT 


ATACTTAGCG 


GCGATGGGGA 


240 


30 


CATTTTTATT 


AGGTTCTATT GTTGCAGCCT TAGCTCCGAA 


TTTTGGAGTT 


TTAATGTTAG 


300 




CTCGTGTAAT 


TCAAGCGATG GGTGCAGGCG TACTTATGCC 


CTTAATGCAA 


TTTACGTTAT 


360 




TTACATTGTT 


CAGTAAAGAA CATCGAGGTy TtGCAATGGG 


ACTAGCAGGT 


TTAGTAATTC 


420 


35 


AATTTGCACC 


AGCAATAGGA CCTACAGTTA CAGGATTAAT 


TATTGATCAA 


GCGAGTTGGC 


480 




GAGTTCCATT 


TATTATAATT GTAGGAATTG CTATACTTGC 


CTTTGTTTTC 


GGTTTGGTTT 


540 




CAATCTCGAG 


TTACAATGAA GTGAAATATA CGAAATTAGA 


TAAGCGTTCA 


GTAATGTATT 


600 


40 


CAACTATTGG 


GTTCGGGTTA ATGCTATACG CATTTAGTAG 


TGCAGGAGAT 


TTAGGATTTA 


660 




CAAGTCCAAT 


AGTAATAGGT GCGTTGATAT TAAGTATGGT 


TATTATCTAT 


TTATTTATAC 


720 


45 


GTAGACAATT 


TAATATTACT AATGCACTTT TAAATTTAAG 


GGTTTTTAAA 


AATAGAACAT 


780 




TTGCATTATG 


TACGATTAGT TCAATGATTA TAATGATGTC 


AATGGTTGGA 


CCTGCGCTGC 


840 




TTATACCGCT 


ATATGTTCAA AACAGTTTAT CTTTATCTGC 


CTTGTTATCA 


GGACTTGTTA 


900 


50 


TCATGCCTGG 


TGCAATAATA AATGGTATTA TGTCAGTTTT 


TACAGGTAAA 


TTTTATGATA 


960 




AGTATGGTCC 


TAGACCATTG ATTTATACTG GTTTTACAAT 


TTTAACAATT 


ACTACAATTA 


1020 
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GAATGTTTTC AGTTTCTTTA CTCATGATGC CGATAAATAC TACAGGAATT AATTCTTTGA 114 0 

GAAATGAAGA AATCTCACAT GGCACGGCTA TTATGAACTT TGGTCGTGTA ATGGCTGGTT 12 00 

CACTAGGCAC AGCTTTAATG GTTACATTAA TGAGTTTTGG TGCAAAAATA TTTTTATCTA 126 0 

CATCGCCATC GCATTTAACT GCAACTGAAA TTAAACAGCA ATCCATTGCT ATAGGGGTGG 1320 

ATATCTCATT TGCTTTTGTA GCTGTGCTTG TTATGGCAGC TTATG TG AT A GCACTTTTTA 13 80 

TAAGAGAACC TAAAGAAATA GAAAGTAATA GAAGGAAATT TTAAAATAAT TATAGTAGTT 14 4 0 

GGTCTATTTA AAATAATAGG CTAACTGCTT TTTTTATTTA ATAAAAAGTT TTATACTTTT 150 0 

AGTGATAGAC TAAGCAAAAA TTGTTATTTG CTATGATGTA GATGTCTTAA AATGATTAAG 156 0 

GGGGATTTGC TTTGTTAACG GTAGATCAAG TGAAAGAATT GGTAGGAGAA ATTAAAG AT C 16 2 0 

CTATTATAGA TGTGCCTTTA AAAGAAACAG AAGGTATTGT TG AnGTTT CT ATTAAGGGAG 16 80 

AAnAAGAACA TGTGAGTGTT 170 0 
(2) INFORMATION FOR SEQ ID NO: 24 3: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10146 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24 3: 

TGCATCAACT TTCAAACAAT AAATCATCAC AATAACCACA CCTAATTCAA CACTTTTCAA 6 0 

ACATAAGTAT TGACACATTG AG C AAAATG A TTTTTAATTG TAACTAATAC AGTTACAATT 12 0 

ATGAGG TGAG AAACATTGAA TTTAGAATTT AACATTGCCG TGCATGTATT AGCTTTTTTA 180 

ACTAAG CATC aTTCAGAAAA ATTCAATAGT AGTTCATTAG CAGAaTTAaC TTGTTTAAAT 24 0 

CCTGTTCAAT TACGACGCGT GACGACTCAA CTTGTCGATT TAAAAATGAT TGACACAATA 3 00 

CGAGGTAAAG ATGGCGGTTA TTTAGCAAAT GATCAAAGTG CTGATGTCTC TCTAGCAACA 3 60 

TTATaTAAAC ATTTTGTCTT AGAGAAAGAA CACCACACAC GTCTATTTAC TGGCGACGAA 4 20 

GGCAGTCACT GTCAAATTGC TCGTAATATT GCAACTACCA TGTCACATTA TCAGCAAGAC 4 80 

GAACAGAATA TCATTATTAA TTTTTATAAT GGAAAAACAA TCAAAGATGT CATTGAAGAC 54 0 

ATTCAAAAGG AGGATTTATG TCATGAAAAC ATATGATTTA ATTGTAATAG GATTTGGGAA 6 00 

AGCTGGTAAA ACTTTAGCGA AATACGCTGC ATCAACAGGT CAACACGTCG CAGTTATCGA 6 60 

ACAATCTCCG AAAATGTATG GAGGCACTTG TATAAACATA GGATGTATAC CTTCGAAGAC 72 0 



1029 



EP 0 786 519 A2 

TGTTGTCAAT GCG CTAAACA ATAAAAATTA CCACTTATTA GCAGACGATA ACAACATTGA 84 0 

TGTACTGGAT TTTAAAGCGC AGTTTAAATC TAATACTGAA GTGAATTTAT TAGATCAACA 90 0 

5 TGACGATATC GTCGATAGTA TTACTGCACC TCATATCATT ATTAATACCG GTGCTACCTC 96 0 

TGTCATTCCT AACATTAAAG GCCTTGATCA AGCTAAACAC GTCTTCGATT CGACAGGTTT 102 0 

ATTAAACATT AG CT AT CAAC CTAAGCACCT CGTTATTGTA GGTGGCGGTT ATATCGCCTT 108 0 

to 

AGAATTTGCT TCAATGTTTG CGAATTTAGG TAGTAAGGTA ACAGTATTAG AACGTGGCGA 114 0 

ATCATTTATG CCACGCGAAG ATCAAGATGT CGTTGCATAT GGTATTACTG ACTTAGAAAA 120 0 

TAAAGGCATT GCATTGCATA CAAATGTTGA AACGACTGAA TTGTCAT CTG ACAATCATCA 126 0 

15 

TACAACAGTC CATACCAACG TTGGTAACTT TGAGGCTGAT GCAGTACTTT TGGCTATCGG 132 0 

GCGCAAACCG AATACGGATT TAGCTTTAGA AAATACTGAT ATCGAATTAG GCGACAGAGG 13 80 

20 CGAAATTAAA GTCAATGCTC ATCTTCAAAC AACTGTGCCG CATATTTATG CTGCAGGTGA 14 4 0 

TGTTAAAGGC GGACTTCAAT TTACGTATAT ATCTTTAGAT GATTATCGAA TTATCAAATC 150 0 

AGCGTTATAT GGTAATCAGT CACGTACGAC TGACAATAGA GGCAGCGTGC CTTATACAGT 1560 

25 ATTTATAGAT CCACCATTAT CACGTGTTGG ATTAACTAGT AAAGAAG CTG CCGCTCAACA 16 2 0 

TTATGATTAC ACTGAACATC AACTTTTAGT AAGTGCTATA CCTCGTCATA AAATTAACAA 168 0 

TGATCCAAGA GGTTTATTTA AAGTAGTCAT TAATAATGAA AATAATATGA TTTTAGGTGC 174 0 

30 TACATTATAT GGTAAGCAAT CTGAAGAATT AATTAATATA ATTAAACTTG CGATTGATCA 1800 

AAACATTCCA TATACCGTAT TACGAGATAA TATTTATACG CATCCTACGA TGGCCGAATC 18 60 

ATTTAATGAT TTATTTAATT TCTAGACAAA ACATAAAAAC CTGGTGGCAC GCATTGAATG 192 0 

35 

ATGCTG CCAT CAGGCTTTAT TGTTGTGCTT TTCGCTTTTC TAATTTTTCT TTAAGCTTTC 19 80 

TATCTTGTTC TT CTTTACG A CGTTTACGTT CTTCATGTCG TTTTCTTAAA CGCTCTTCTT 204 0 

CTTCAGGATC ACGTGGTTTC TTTAATTGTT GAGAAACTTT TTCGATTAAT TCTTCTTCAG 2100 

40 

TAAGCGCagc CAGTGGGCGG TTATTAACAA AAGTGAATGT TTTTCGGCGT CCAGGTCCAC 2160 

AATAAGATTG ACAACCTATC ACGATTTCAG CATCGGGATC TAATTTTTCC AACTTCTTTT 222 0 

45 GTAACGTT CT TATATTGACT GCCTGACATT CATCACAAAT AAGGAATGTA TTTTTCATAT 22 8 0 

TGCTACCCAC CTTTCTTTAT CATATCTATA TCGTCGATTT CATTAATTTT TTCGTTAACT 234 0 

CTATCTATTT TACTCTTTTT AATATTTTTT TCAAGATACG TAACACGG CT GaCAATAAAA 24 00 

so AATGG AG CAT TTATCTTCTA ATT AAA TT AG ATGaTTGCTC CCCTATCAAA TCATTTATTG 24 6 0 

CCCATGATAA ATATTAAATT TTAATGGTTT AATACCATGT TTTGTCCATT CA T CAT AAAT 2520 
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TGATGTTTTA GATGCGCCGT 


GATACTTTTC 


AGCAATATCA 


CACAAATATT 


TTAGCTTTTC 


2640 


AGTTTCTATA TCAACTGTAG 


CTTCTTTATC 


CATACGTTGA 


ATAATTGTAC 


GATTCTGACG 


2700 


CACCATCTTT TGCACACCTT 


TAATGTTATT 


TGTTTTAAAA 


GCATGAATAA 


GTTTTTCAAC 


2760 


ACAACGATGT GAATCTTCTA 


AGAAGTCACC 


GTAAAATGAA 


GGATCTGATT 


TCAAACGTTT 


2820 


CACTTCGCTA ACAAAGTGTG 


GTGATGACGC 


CGGTGAGCCA 


GTCCAACCGA 


TAAGTACTTC 


2880 


CATATTTTCA GGTGCTTGTA 


ATGGTTCGAT 


GTGCAATCCA 


GGCCAGTTTT 


TGATTAAAAC 


2940 


TTCTTCAACC GTAGTATCTT 


CAATTTGATG 


CTTAACCCAT 


TCATGATCAA 


AAGTACTATA 


3000 


CGCTAGCCAT CCACTATATA 


CACTCACAGC 


AATATCTCCG 


CATGAACTTA 


AACTTTGTAA 


3060 


CTTCATATTT GCAATCACTG 


CTAGTTTATA 


AATGTATAAA 


TTAGATAACT 


TCATATCATA 


3120 


AAATTCATTT AATACTTTTA 


TAACTGACAC 


AAGTACTGCT 


GCACTTGAAC 


CTAATC CATA 


3180 


TTTATGACCA TTTGAATCAT 


CTAAATTACT 


ATCAATAGTC 


AGATGAAAAT 


GCTTCATCGC 


3240 


TATATCGCAA CTTTTCGCGT 


ATTGTTCAAA 


TATTTCAATA 


GCTGTGaCCA 


CATAATTTAA 


3300 


TTGTTTTGCT GcATGTGGAT 


CTGAAATGAC 


AATACTATCT 


TCATCTCTAC 


TAAATGTAAC 


3360 


TGGGTTATGA TGTAATGCTT 


TTGAATGAAT 


GGTACCTTTA 


TATTGGTCTG 


CTTCTTCAAT 


3420 


AGTAGCAGTT ACAAAACGAT 


CTAACGCAAT 


AAGTACAGAT 


TTATATCCTG 


GTTCTGTTAC 


3480 


AGCATATTCT CCAGCAATAT 


AAAGTTTTCC 


GGGTGCTTTG 


AC CTGAAT CA 


TTTTATCTCT 


3540 


TCCTTACTCA ATTATTTCAA 


TTCCTGTGGC 


AATAATGTCA 


CTATCAATAA 


TTTGGTTATT 


3600 


ATCAAACTGT GTTAATAATT 


TATCTATAAT 


CTGTTGCTTG 


TTTTTCTTTT 


CTACAAGTAT 


3660 


TTTCACATTA GGTCCCGCAT 


CCATTGTAAA 


ATAACACGGA 


TACCCCGCTT 


CTCGGCATTC 


3720 


GTGAACAAGC GCCATGACAT 


CATAACTTTC 


TTGCACAAGA 


TATGTGAACG 


GCGGTGTTGA 


3780 


TCCTAGATTC GTGGCATGCA 


TACGCAAACC 


ATTTTCTTCA ATTACTTCAC 


CAAGGCGTTT 


3840 


AAAATCTTTG TCTTGAATCG 


CTGCTTTTGC 


TTCAGCTAAA 


TCTTCATCAA 


TATGATCTAA 


3900 


CCAATATTGA TAAAACCTTG 


ATGTGTTTCG 


TGTCAATGAC 


ATACCATATC 


GACTAGGTAC 


3960 


CTTTTTAGAA TGTTGATTAA 


TCACAACAAA 


TATCATGGCA 


AGGTCATCTT 


CAAAATGATT 


4020 


CGATTCAAGT GGAACGGCAT 


ATGACGTCTC 


ATCACTATAC 


CCTTTTTCCC ATTCTGCAAA 


4080 


TCCACCATAA ATACTACGCG 


ACGCAGAACC 


CGAACCAATT 


CGCGCCAATC 


TCGATAAATC 


4140 


CTTATCTGAC AGCTGCATGT 


CTAGCGCTTG 


ATTACAAGCT 


GCTGCTAAAG 


CTGCATATGC 


4200 


GCTTGCCGAT GAAGCCAACC 


CTGCTGCTGT 


TGGTACAAAA TTGTCGCTTT 


CAATTTCTGC 


4260 


ATACCAATCG ATGCCAGCTC TATTTCTGAC AATATCCATA TATTTTGAAA TTTTCTCTAA 


4320 
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AAAAGTGACT TTCGTTTCAG TGTAAAATTT TTCTAATGTA ACAGATATGC TATTATTCAT 44 4 0 

TGGAATGATT AGTGCTTCAT CTTTTTTACC CCAATATTTT ATAAGTGCAA TATTCGTATG 4 5 00 

5 

TGCACGTGCT TTGCCACTTT TAATCAACGC ATTAACCTCC TAAATTCTCA ATCCAAGTAT 4 56 0 

GTGCTGCACC AGCTTTTTCT ACAGCTTTTA CAATATTTTT CGCTGTTGGT AAATCTTTGG 4 620 

CAAGCAATAA CATACTTCCA CCACGACCAG CGCCAGTAAG TTTTCCAGCA ATCGCACCAT 4 680 

10 

TTTCTTTACC AATTTTCATT AATTGTTCTA TTTTATCATG ACTAACTGTC AACGCCTTTA 4 74 0 

AATCCGCATG ACATTCATTA AAAATATCCG CTAAGGCTTC AAAGTTATGA TGTTCAATCA 4 800 

js CATCACTCGC ACGTAAAACT AACTTACCGA TATGTTTTAC ATGTGACATG TACTGAGGGT 4 860 

CCTCACAAAG TTTATGAACA TCTTCTACTG CTTGTCTTGT TGAACCTTTC ACACCAGTAT 4 920 

CTATAACAAC CATATAG CCG TCTAAACTTA ACGTTTTCAA CGTTTCAGCA TGACCTTTTT 4 98 0 

20 GGAACCAAAC TGGTTTGCCT GATACAATCG TTTGCGTATC AATACCACTT GGTTTA CCAT 5 04 0 

GTGCAATTTG CTCTGCCCAA TTAGCCTTTT CAATGAGTTC TTCTTTCGTT AATGATTTCC 5100 

CTAAAAAATC ATAACTTGCA CGAACAAAAG CAACCGCGAC AGCTGCACTC GATCCTAATC 516 0 

25 CACGTGATGG TGGTAAATTC GTTTGGATCG TTACTGCTAG CGGCTCTGTA ATATTATTTA 522 0 

ATTCTACAAA ACGGTTCACC AAAGACTTAA GATGGTCAGG CGCATCATAT AACATACCAT 52 80 

CGTAAACATC GCTTTTAATA GACGAATAGT TCCCGCTCTC TAAGGCTTCT ATTAAAACTT 53 4 0 

30 TGATTTTACC TGCGTTAAAC GGTACTGCAA TAGCAGGCTC TCCAAATGTA ACAGCATGTT 54 00 

CTCCTATTAA AATAATCTTA CCTGTCGATT CCCCATATCC TTTTCTTGTC ATGT CAATAT 54 6 0 

CACCTTTTAT ATTTATCCTA TACTTGATTC ATTATTTTTA TTTATTAGTA AAAGACATCA 5 52 0 

35 

TATTCTAAGT TGCAtngCAT TCGCGTTAAA TTTCATTGCA GTCTTTATCT CACATTATTC 5 58 0 

ATATTATGTA TAATCTTTAT TTTGAATTTA TATTTGACTT AACTTGATTA GTATAAAACT 5 640 

AACTTTCGTT TACTT CAAAG TTTAAATCTT AT CG AGTGAT ATTTCAGATT CTTTATCTTT 5 7 00 

40 

TTATAAAATA GCCCTACAAT TTATAATTTT CCACCCTAAC TATAATACTA CAAATAATAA 5 760 

TTGGAATATA TAGATTTACT ACTAAAGTAT TAGAACATTT CAATAGAAGG TCGTTTCTTT 582 0 

45 CATAGTCATA CGCATTATAT ATACCCTATT CTCAATCTAT TTAATACGTA AAACATGAAA 58 80 

TTTTCTTATT AAATTTATTA TTTCCATCAT ATCATTACTT TTAATTTAAT GATGTTCAAT 5 94 0 

TTAAATATTA GGTCAATAAC ATATTTATGC TTTTTATGGA TACTTTCAAA AATAACAGCC 6 000 

50 CCAAACGATA ACTTGAAAGG GGCTGTTAAA TATTTAACTA TTGCATTTGA TCTATCATTT 6060 

TCTTGTTTCT TTCAATCATT TTATCAAAAT ACGTATCGTA TCTTTGCCAT T CTT CTTGAG 6120 
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TTACATCTTG AACAGTAATC GTTTTGTTAA GCAATGTCTC TAATGAGGCC ATACAAGATG 624 0 

GTTCAATTTC AGGATATTTA AATTTAGTCA CTTCACCTTT TAAAGCATGT TCATAAAATG 6 3 00 

5 TTTGCATCAT CAATG CACGT TCTGAACCAG AGCCTTCAAC ACAAAGATAA ATTTGTACAG 63 6 0 

CAATACCGCC TCTAACTCTT CGTTGCGATA TGCCTGCAAA TTTCTTACCA TCGATACTTA 64 2 0 

AGTCAAATTT TCCTGGGCAA TAAGAATGTT CAATTTCCAT CGTATCAATA TCAACATTCT 64 8 0 

10 CATTTTCGAA CATTTTGCTA ATTAAGAGGT ACATCACAGT AAACGCTTCA TCAATCGTTG 6 54 0 

TTTCTGTTTG TCCTTTGAAC ATCAG CGATA TATTTAATAC ACCTTGATCT AGAACGACAC 660 0 

CTAAGCCACC AGAATTTCTA ACAATGG CAT TATAACCAAT CTCATTCGTT AAATAATCAA 66 6 0 

J5 

TGCCATCTTT TAAAAACGGC AATCTTGAAT CATGAATACC AAGAATAACA GTATGTTGAT 67 2 0 

GAATCCAAGT ACGCACAACA TTATCTGATA TATCTTTGCC CACACTTTCG CAAAATGTAT 678 0 

CATCGAATGC GAAAGATTGC ATAGGTTCTA ATCCAGAAGA ATGATCGATA TATCGCCAGT 6 84 0 

20 

TGACGCCATT AAAATATTTA CTCGCTAAAT CCATCGTTAT TGTAAGGCTT GCGCTGCTGT 6 9 00 

AATAATTGAA AGATTGTATA CATCTTCAAT TGAGCAGCCA CGTGATAAGT CATTTACTGG 6960 

2S AGAATTTAAA CCTTGTAATA CTGGACCAAC TGCATCATAT CCACCTAAAC GTTGTGCAAT 70 2 0 

TTTGTAACCA ATATTAC CAG CTTCTAAACT TGGGAATACA AAGACATTTG CATCACCTTG 70 8 0 

TAATTTAGCA CCTGGCGCTT TTTTCTCAGC AACACCTGGT ACAATCGCAG CATCAAATTG 714 0 

30 GAATTCGCCA T CAATG ATTG CTTCTAATTT TtCTTCTTCA GCTTTTtGTT GTGCTAATTT 72 0 0 

GACAGCTT CT TGAACTTTTG TCACGTCGTC TGATTTAGCA GACCCTTTTG TTGAAAAGCT 72 6 0 

TAACATTGCA ACTTTTGGAT CCATGCCAAA GCTTAATGCT GATTTTGCAC TTTCTACTGC 73 2 0 

35 AATTTCTGCA AGTCCTTGTG AATCAAGTTC TGGATTGATT GCACAATCAC CAAAGATGTA 73 8 0 

TTGTTCATCA CCTTTAATCA TAAAGAAGAT ACCTGATGTT CTTGATACAC CTGGTTTCGT 74 4 0 

TTTGATGATT TGTAAAGCTG GACGCACAGT GTCGCCTGTT GAATGTGCTG CACCACTAAC 75 0 0 

40 

TAAACCATCT GCTTTACCAG CATAAACAAG CATTGTACCG AAGTAGTTCA CATTGTTTAA 756 0 

TAATTCTTGT GCTTGTTCTT CAGTCGCTTT ACCTTTACGT CGTTCAACAA ATGATTGAAC 762 0 

TAATTCAGCT TTCAATTCAC TTGTCGCAGG ATTAATTAAT TCAATATTAG AAATATCAAG 76 8 0 

45 

ATCAAGTTTT TGCGCTAAAG ATTGAACCTT AGTCTCATCA CCTAACACGA TTGGTGTAAC 774 0 

ATAATCTGTT GCT TGTAATT GTGTTGCAGC TGTTAGAACA CGTTCGTCCT CTCCTTCAGG 78 0 0 

5Q TAATACGATT TTAACGTTTT TACCAGAAAG TTTGTCTTTT AATACATTTA ATAAATCAGC 7 86 0 

CATAATGTCC TCCTGTAATA TAAATCTTAT TAATCATTCA CGGTATAATT ATACGCCATT 792 0 
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TATGATAAAA TTTATAAAGA ACTGATGATT TTTGAAAAGG AG CGATAAAC ATGAGTCAAG 8 04 0 

CAGCCGAAAC ATTAGATGGT TGGTATAGTC TACATTTATT TTATGCAGTT G ATTGGG CAT 810 0 

5 CATTACGTAT AGTTCCAAAG GACGAACGCG ATGCACTTGT CACTGAATTT CAATCATTTT 8160 

TAGAAAATAC AGCAACTGTA AGATCATCAA AATCTGGTGA TCAAGCTATT TATAATATAA 822 0 

CTGGTCAAAA AGCAGATTTG TTATTATGGT TCTTACGTCC TGAAATGAAG TCTTTAAATC 828 0 

W 

ATATTGAAAA TGAATTTAAC AAATTGCGCA TTGCTGACTT CCTAATCCCT ACATATTCAT 834 0 

ATGTATCAGT CATTGAATTG AG CAATT ATT TAG CTGGTAA ATCTGATGAA GATCCTTATG 84 00 

AGAACCCTCA TATCAAAGCA AGATTATACC CAGAATTACC ACATTCTGAT TATATTTGTT 84 6 0 

IS 

TCTATCCAAT GAACAAACGT CGTAATGAAA CTTATAACTG GTACATGTTA ACTATGGAAG 8 52 0 

AACGCCAAAA ATTAATGTAT GACCATGGTA TGATTGGTAG AAAATATG CT GGCAAAATCA 858 0 

2Q AACAATTTAT TACTGGTTCT GTAGGGTTTG ATGATTTCGA ATGGGGCGTA ACATTGTTCT 864 0 

CAGATGACGT ATTACAATTC AAAAAAATTG TATACGAAAT GCGCTTTGAT GAAACAACAG 8700 

CACGATACGG TGAATTCGGT AGTTT CTTTG TAGGACATAT TATTAACACA AACGAATTCG 8 76 0 

25 ATCAATTCTT TGCGATTTCT TAATACATTG GTACGTTTAT AAATTAATAA AAAAATTCCA 882 0 

AGCTTATCGG TTTAAGCTTG G AATTTTT CG TTTATCTTCA GTATATTCCC GTATACATAA 88 8 0 

GACGTGATTT GGTAAATAGT TGAAATCTGT ATGTTTAAAC TTATATATAT GTGCTAATGT 8 94 0 

30 ATTATCAATA ACAAAGtACA CTTTGCTCAT AGCAAgTsaC CCGAgTAGTC TTCCTTGGGA 9000 

GAACTTTAAC TACTATCACT ACATATAAAC GTTAACCTCA ATAGAAATTA TACAGTCGCT 9 06 0 

ACTCTATACA ATTTTTGTAA TGGTTAACTA ATATTATTTT AACCTATTTG AAATATTTGA 9120 

35 

AACATATTTT TGTCGAATTT TTTTCAATAA TTTTTCCTTT TTATACTTCA AGAGAATTTT 918 0 

AACTACTAAA AATTCCGATG ATTATTATTA CAATAGTATC AAATATTAGT TTTTTAAAAT 9 24 0 

CAATAACAAC TTATCAAAAA GCTCATGTGG TTATTTTATA GTGTATAAAC TATAATGAGT 9 3 00 

40 

ATTAAATTCT TATAAACAAT GGTGATGAAA TGGACATAAA TTCAGAAGAA TACAAACAAG 93 60 

AGGTACTTAT CAAAGACGTT GTCATGCTTG CTGCTCGCAT ACTATTAGAA TCTGGTGCAG 94 2 0 

4s AAGGTACGCG TGTAGAAGAT ACCATGACAC GTATTGCAAA AAAACTTGGT TACAGTGAAA 94 80 

GTAACAGCTT TGTTACAAAC ACTGTCATCC AGTTTACGTT ACATTCGGAA TCGTTTCCTA 9 540 

GAATATTTAG AATTACCTCT CGAGATACAA ACTTAATAAA AATTTCTCAA GCTAATAAAA 9 6 00 

50 TTTCGCGTCA AATTACAAAC AATGAAATTT CTTTAGCCGA AGCAAAAACG CAACTTGAAA 96 6 0 

AAATATATGT TGCTAAGCGT GACAGCAGTC TTC CCTTTAA AGGTTTTGCT GCAGCAATGA 9720 
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TAGCAGGTAG TCTAGGATAC CTAGTCACTG AGATTTTAGA TCGTAAGTwA CACGCACAGT 9B4 0 

TTATCCCAGA ATTCaTTGGT TCaTTAGTTA tTGGGATTAT CGCCGTTATT GGACATACAC 9900 

TTATTCCAAC AGGTGACTTG G CAACTATTA TCATTGCGGC AGTCATGCCT ATTGTT C CTG 996 0 

GTGTATTAAT AACAAACGCA ATACAAGATT TATTTGGTGG ACACATGTTG ATGTTCACAA 10020 

CGAAATCATT AGAAGCATTG GTTTnG CGTT TGGCATCGGT GCTGGCGTTG GTAGCGTATT 10080 

AATTTTAGTA TAGGAGTATC AG ACTATG TT TTGGATCTTA AACTTTATCT TTAG CTTTTT 1014 0 

AGCTTC 10 i4 6 



(2) INFORMATION FOR SEQ ID NO: 244: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2022 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 244: 

ATTTAATTGG TTGGTGGCGT ATTCTCnTTT CCAAGATTTG CCACGATTGG ATGTTCAGTC 6 0 

GACAAATATG TAACCAGTCC CGATAAATTA CGTT CCTCAA TCATTGATAG TATGTCTGGT 12 0 

GTTTGTAACG ATTTATCGAG TAAGGCATCA AGCAATTGAT AATGTCCCAA TACAACAAAA 180 

TGCACGTTGT CTCTCAACTG CTGTTGAATA AACTGAATAA AGAGCTTTAA GCTCTGTTGC 24 0 

ACATTCGCTA ATGATGGTGC ATAGTTTTCC AAACCAACTT GTACAGCCGC TTCATTATTC 30 0 

CGAATGATTA AACCTGTGTA TGCCACTTTT GTTGCTGCAG TTGGATACAT TGAGTAATAA 360 

CGCAATAATT GATCTGTAAA ATCATTTCGA AGTGCATAAA TTTGATGCTC ATGTTGCCAA 42 0 

AAATCTCGCT CACCCATCTG CTgCAAATCC TCATGGTTCA ATTGTTTCCA GTCCAACTTT 48 0 

TCAACCACAC TAAAATCAAC TAACTCATAA TCCGCTTTAT TAAAATATTT TAAAAATGCT 54 0 

GTTTCCGATT CTTTTAACGC AATTAATTGT TCTGnATTAT TCACTCGACC ACCCTTTACT 60 0 

TTCAATACTG TATTTAAAAT CACTTGGTAT TTTCGTTGTT TGCTTTACTT CTCTACCACG 66 0 

CTAAAGTGTA ATATGATTAA TAACTTATCA TTTTTAGCAA TACATTACAA CCTTTTTCAG 720 

AAAATTCGGT GTATTGATTT TAAAATTTTT TAAAATAnAA AAGG CAAGAC ATTTGTGCCT 780 

ATAAAAATGC TTAACCAAGA TTTTTATATT GaAGTTGTAC TTCTTGCACA TATTGTCCTT 84 0 

GCCTTATTAT GTAAAGTTAT TTTCTTTCTA TCTTTTTATT AAATTTAACT ATTCTTCATA 90 0 

ATCCCGATTC CCTTTAAAGT AACGTCTATC TTG TTTACTA TATACATTTT CAGGATTAAA 960 



55 



1035 



EP0 786 519 A2 



TTGGTAAACG TTCGTTGCTG ATATATCTGT AAAATTGTTT GGACCGACAC CTGCAATAAA 10 80 

CTTAAACTCT GCTTCATCTA CCAAATAATC ATACGCTTGT GTATGTCTAT CCTGTGCGCC 1140 

5 

ATGTGGAAAT ACAAACATAT CTGTTTTACC TACAATTGGT TCAACTTCAT CTTTCCATCT 12 00 

TTTAGTATCA CGTTTAATAC CTTCTAAAGA TG T T TT T T CA AAATTAATGT GACCATATGA 126 0 

ATGACTCGCA AATGACCATC CATCCCGTTT CATTGCGCGA ACAACTTCCT CAGCTGCCTT 1320 

10 

TTTATTCTTT GTATAATCTT TACTCGTTAA TTCATTCGTG CGATAACCTA ATACGCCCTC 13 8 0 

ATAACCGGTT AAAGCAACAA CACCTTTTTC ACCATTTAAA GAAAAATCTG GATGCTCTTT 14 4 0 

j£ TACAAATTTA TTTAAAATTG GCACGATATC ATTGTCATCA GAATAAGTAG CATGGCCTTT 15 0 0 

TTTGTCTGTA GTTTCAGAAA CAACATGTTT ATTTTTATCG AGTACTAAAC GGTCAG CATA 15 6 0 

ACCATGGTGT CTCATGTAAC TATAGTAATT CATATCATCA ATTGAGATGA TTAGTGGCTT 162 0 

20 TTTACCTTTC GGCAATTTTA TTTTTTTGGC TTTTACATGA TGAGATGATA AGTCGTATAC 16 80 

ATCATGTGGA TTAACGATGA TGTAATTATT TTTATATAAT TCGTTCAATG ATTTTTTAAA 174 0 

TTCACTTACA GTAATCATCC AATCATTGTT GCCCTTAGCT TGGTGTGTAT CTCCTGTAAA 18 0 0 

25 CGCAACTTTT GGGTCTGTAA TTAATGGGTG ATAAAACACA TGATAAACTT GGCCGTGATA 186 0 

TGTTTCCCAA TGTTCATCCA TTTTcGATTT aTGCTTTGCA TACTCATTTG GATTAACAGA 192 0 

TTTATTkTGA GCTTTCTCAT TTTGCTTGGA ACAGCTATAT mACAATGCAA CTGATAATAA 198 0 

30 CAGAAAAAAT AGCAATAAAT ATTTTTTATG C ATT AAA CAT TC 2 022 

(2) INFORMATION FOR SEQ ID NO: 24 5: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 1340 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

!xi) SEQUENCE DESCRIPTION: SEQ ID NO: 245: 

ATAGAGTGAT AAAGGATGGT TGTCATATGA TAAATGCAGT AGTAATAGCA GTAATTTTAA 6 0 

45 TGATTGTGCT ATGTTTATG T CGATTAAACG TnTTATTAAG CTTATTTATC AGTGCGCTAG 12 0 

TTGGTGGCTT AATTTCAGGC ATGAGCATTG AAAAAGTTAT AAATGTATTT GGGAAAAATA 180 

TAGTCGATGG TGCTGAGGTA G CATTAAGCT ATGCTTTATT AGGTGGATTT GCAGCATTAA 24 0 

SO TTTCATACAG TGGTATCACA GACTATTTAG TAGGAAAAAT TATAAATGCA ATTCACGCTG 30 0 

AAAATAGTCG ATGGTCAAGA GTTAAAGTCA AAG TGACAAT AATCATTGCA TTATTAGCTA 3 60 
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CACCATTGTT AAGTCTGTTT AATGACTTAA AAATAGATAG ACGTTTAATC GGTTTGATTA 480 

TCGGTTTTGG TTTATGTTTC CCGTATGTGT TATTACCATA TGGATTCGGT CAAATTTTCC 54 0 

AG CAAATTAT TCAAAGTGG C TTTGCAAAGG CAAATCACCC AATTGAGTTT AATATGATTT 60 0 

GGAAAGCAAT GCTTATTCCT TCAATGGGGT ATATTGTTGG CTTACTTATC GGTTTATATG 66 0 

TATATCGTAA ACCACGTGAA TATGAAACAC GTAAAATTTC AGATAGTGAC AATG TTACAG 72 0 

AGTTAAAACC ATATATCTTA ATAGTAACAA TTGTAG CAAT ACTAGCTACA TTTTTAG TAC 7 80 

AAACATTTAC AGATTCAATG ATTTTTGGTG CACTGGCAGG GGTACTCGTA TTCTTTATTT 84 0 

CACGTGCATA TAATTGGTAT GAATTAGATG CTAAGTTTGT TGAAGGTATT AAAATTATGG 90 0 

CTTATATTGG TGTAGTTATT TTAACAGCAA ATGGATTTGC TGGTGTAATG AATGCTACTG 96 0 

GTGATATAGA TGAATTAGTT AAAACTTTAA CAAGTATTAC TGG TGATAAT AAATTATTTA 102 0 

GCATTATCAT GATGTATGTG ATAGGTTTAA TTGTCACTTT AGGTATTGGA TCATCATTTG 108 0 

CAACAATTCC TATTATCGCA TCATTATTCA TTCCTTTTGG AGCGTCAATT GGACTAGATA 114 0 

CAATGGCATT AATCGCATTG ATTGGAACAG CGAGTGCATT AGGTGACTCA GGTTCGCCTG 1200 

CAAGTGATTC AACATTAGGA CCAACTGCGG GATTAAATGT TGATGGCCAm CATGATCATA 126 0 

TACGTGATAC ATGTG TACCA AACTTCTTGT TTTATAATAT TCCTTTAAAT GATTTTCGGT 1320 

ACTATTGCTG CTATGGTACT 134 0 
(2) INFORMATION FOR SEQ ID NO: 246: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 336S base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 246: 

CAAAATCTAA GAGAATAAnA TTTGTTAATT TnAAATAGCA AGCAATTCAA AGTTATATGT 6 0 

GTAATAGATA AAATAGATAT CCCTATAGTG ATGCGTTACT AGCTAAACAT AATAACACAT 12 0 

TAGAAGATAA TGAAGTTAAG GAGTTACTGG ATTGTTTCGA CTATGTAATT AAGTATAAAA 180 

ATATCCAACG ACAAAACGTA ATTATAAAAT GGTAAAAGCT ATGGTACAGT TTCAAATTGC 24 0 

TAATGACATG CGTATCGGTG AGCTACTTGC AATAAAGAGA GTAAATATAA ACTATGAAGA 3 00 

TAAAACGCTA GATATCGACG GTAAAGTTAA TTGGATAACT GAAAAAAGAC GGGAGCATTC 3 60 

GGAGTAAAGG AGACAACTGA AAGAAGTAAT AG CTATAAGG CCACAGGGCT CACTACCCAA 4 20 
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TATTCACAAA TACGTCTGGT AGCCCTATCG ACTCGAACAA AATTAGCCAC ATTATTAAAG 54 0 

GGGGGCGCTG ATATTAGTTC TATTAAGAAA CCTATAACGA CGCATACATT ACATCATTCG 600 

CATATATCTA CACTTGCTCA ATTAGGAATT AACTTAAAAG CAATGCAAGA GCATGTAGGT 660 

CATTCAGATT ATAAAArAAA TCTAGAGATA TACA CACATG TTACTAATCA GATGGCGAAA 72 0 

GATATGATGA ATAAAT TTGA ACGATTGGGG AGTTAAAATT GGAAAAAGAT GaTACACTAG 78 0 

CAGAAATTAA GCCTATGCTC AATTTTGATG AG CAAATAG C AAAATTAAAA CAGATGAATA 84 0 

TATTTTTTAA TATTATTGAC ACCGAAAAAG CAAATGAAAT TCTTAGAAAA AATAATTACT 900 

TCTTCAAACT wGcTTATTTC CGaAAAAATT TCGrAAAAAA GaATGGCGGC TATTTCATAG 9 60 

AATTTGCTTA TTTATCAGAT TTAGCAACTA TAGATATGaA ATTAAGATAC ACAATGTTGC 1020 

ATTTAACTTT AGATATTGAA CATAG TTTAA AGTATCTAGT CTTAAAACTA ATAACAGAAA 108 0 

ATAA CCAAGA AGATGGTTAT AAAATAATAG ATGAGTTCTT ATGTATTGaT AAATCATATA 114 0 

GCAATTCAAA TTTTGACACA AATTCAAGAA CACCAGAAGA AGTTATGGAA ACCAAAATCA 1200 

AAAATAAAAA CGAAATATTC AAGCATATGA ATAAACGAGG ACAACTACCC GAGAAGTTGa 1260 

ATAAATACTA TCmAAATCCA CCCGCnnGGk TTTGCaTTGr ATTCATGCAA CTAGGT CAAT 132 0 

TCGTTTCGTT TCTCAACTTC TATTACAAGA AGTACAATGA CGAAGAATTG AGAGTTG CTA 1380 

ATATTTTAAT GCCTTTAGTT AAAAATATAA GAAaCAAATC AGCTCATAAC CAACCCATCA 144 0 

TAGCAAATCT AAATTATGAC AGTAGATTAC CTCAATATTT ATTTGAAAAA GGGAATAATA 1500 

TAGGCATATC TAGAAACATG TTCGGAATAA AAAATTTCAT AGATACTkTC ksTACGCTAG 1560 

AATTACATAA TCAAGTTTGT AGTAATGCAA TTATCCAAGC AAG AT AT CAC GATTTGGACC 16 20 

AACTTCAAAA G CGAT ATAAA AGrAACGrAA GCTATTATAA TAATGCATTA GCTATCAAAA 16 BO 

GATTTTTTAT AG CTTTAG AT AAAATTATTG ACTTCAACAG ACCAAAAGTA TAAACTATCT 174 0 

AGTGAGGAAA GAGACTTATA GGTCTCGCGA GTTATTTTAA TTCGTATGCA AGAAAAAGAA 1800 

GAGCTATGCA TTTTATTTAA AATGCGTAGT TCTTtTTTTA TGCATCTAAA TTCATATTAT 186 0 

TTTTGCAATA TAAACATATC TTTGTGCAAA TTCCGAACAC AAAACATTCA CATCATCCTT 1920 

TTTtGCCCTT TTTCTATACC CCAAAACACA AAAAGCCCCG TAAGCCTATG CcTACGGGgT 1980 

TTGACAATAA ATTATATATT ATTGTTCTTC TTTAA CATAT GGTAATAATG CCATATGACG 204 0 

AGAACGTTTG ATAGCTGTAG TCAaCATACG TTGATATTTA GCTGAAGTAC CAGTTACACG 210 0 

ACGTGGTAAA ATTTTACCGC GTT CTG AG AT AAAACGTTTT AATAATTCAG TGTCTTTGTA 216 0 

GTOGATATGT GTAATACCAT TTG CTGTGAA ATAGCATACT TTTTTACGAC GACGTCCGCC 2220 
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CGTTAATTTT TATTAGAATG GTAAGTCATC ATCAC TTAT A TCAATCGGTC CGTTTGCATT 2 34 0 

TGCAAATGGA TTATCAGATT GTTTCGTGTT TGATGAATTA TTGTACGAAT TGTTTTGTCC 24 0 0 

TGATTGTTGA CCACCGAATC CTTGACCGTA ATCTTGGAAT TCATTTTGTT GACGTTGGCC 24 6 0 

ACCATTTTGT TGCGCATTTT TAGGTTCAAG GAATTGAACG CTATCACACA CAACTTCAGT 2 52 0 

AACAAACACA CGACGACCTT CTTGATTTTC ATAATTACGG GATTGTAAGC GACCATCTAC 2 580 

ACCAG CTAAA CTACCTTTAG ATAAATAGTT ATTTACATTA TCTGCTTGTC TTCTAAAAAC 264 0 

AACACAGTTA ATAAAATctG ctTCGCGCTC CCCTTGAGCA TTCGTGAACG TACGATTTAC 2700 

TGCAAGAGTG AATGtCGCTA CACTCACACC TGAGGGAGTG GTTCTGTATT CCGGATCTTT 2760 

CGTTAAACGA CCTACTAATA CAACTCTATT TAG CATTTAA ACGCCCCCTC TAATTATTAC 282 0 

TTGTCTTCGT CTTCACGAAT AACCATGTAA CGAATGATAT CGTCACTGAT TTTAG CTAG A 2 8 80 

CGTTGGAATT CGTCAGTAGC TTTGTTGTTA TCAGATTTAA CACGTACGAT GTTGTAGAAG 2 94 0 

CCATCTTTGA AATCATTGAT TTCATAAG CT AGGCGACGTT TACCCCAGTC TTTTGCTTCT 3 00 0 

AAAACTTCTG CACCTTCAGT AGCTAAGATA CCGTTGAAAC GTTCAACTAA CGCTTTTTTA 3 06 0 

GCATCTTCCT CAATGTTTGG GCGTACGATG TACATAACTT CATATGTTCT CATTTTATAT 312 0 

TTGCACCTCC TTGTGGTCTA TACGGCTTAT CAATCTTAAA ACAGATAAGC AAGGaATAAT 3180 

TTTCATTACT CACAATAAAG AATTaTATCA TGCGCCATTA CTTTTTACAA TaATAATTcA 3 240 

AACTACTCTT CATAT CATTT TTGATATtAA TTCATTTGaA ACTTT CnATG ATATTTTnAA 3 300 

AAATACACTT CACAAAAGCG AACATATGTn CTATAAnAGT TGTGAGGTGG TAAGGAATGA 3 36 0 

ATTTA 3 365 
(2) INFORMATION FOR SEQ ID NO: 24 7: 

4i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1032 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 247: 

GTTAAAAGTA ATTGGTGGTA TTGATGATGA TTTTACAGCC AATGTTATGC ATCCAAATCA 6 0 

ATATCGAATT CGATATTCGT CTCAGAAACA GGACCTTAAT GAAGATATGA CAGTTTTTGA 120 

TGCAGTATTA AGTTCTGATA CAACAACTTT ACGCATCATC AAGCAATATG AGCAGGCAGT 180 

ACAAGCTTAT GCGGATGACC AAAGTGATAA ATTGTTCAAG CGAATGATGG ATGCGCAAGA 24 0 
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ACTAGGTATA CATGATACTA CTAAATACAT TAAAGAATTA TCCGGCGGAC AACAAAAACG 36 0 

TGTTGTACTT GCTAAAACAT TAATAGAACA ACCAGATTTA TTGTTATTAG ATGAACCTAC 42 0 

GAACCATTTA GACTTCGAAT CAATCAGCTG GTTGATCAAT TATGTGAAGC AATATCCTCA 480 

TACTGTTTTA TTCGTAACCC ATGATCGATA TTTTTTAAAT GAAGTTTCCA CTAGAATTAT 54 0 

TGAACTAAAC AGAGGTAAGT TAGCGTCATA TCCTGGTAAC TATGAATCTT ATATTGAAAT 6 00 

GCGCGCTGAA AGAGAAGTAA CACTTCAAAA GCAACAACAA AAGCAACGAG CTTTATATAA 660 

GGAAGAACTT GCTTGGATGA GGGCTGGgAG CTAaGGCTCG TACTACAAAG cAACAAGCTA 7 20 

GAATTAATCG ATTTAATGAC CTAGAmAATG AAGTTaACCA GCAATATAAA GACGATAAAG 78 0 

GTGAATTGAA TCTTGCTTAT TCaAGATTAG GTAAGCAAGT GTT CGAATTA GAAG A CTTAT 84 0 

CAAAGGCTAT TAATGATAAA GTATTATTTG AACATCTGAC GGAAATTATT CAAAAmGGTG 9 00 

AGCGTATTGG TGTTGTTGGG CCAAATG GAG CTGGTAAAAC AACACTCTTA AATATTTTGA 96 0 

GTGGAGAAGA CCAACAATTC GAAGGTAAAT TGAAGACTGG GCAGACGGTT AAAGTAGCTT 10 2 0 

ATTTTAAG C A AA 103 2 
(2) INFORMATION FOR SEQ ID NO: 248: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 852 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 248: 

TGTGATTAAC GAAG CTT ATT TTCGTACACC TTCAACAACT GATTACAACG GCGTTTATCA 6 0 

AGGT5ATTAT ATTGATTTTG AAGCAAAGGA AACTAAAAAC AAGACGTCCT TTCCTTTAAA 120 

TAATATTCAT GACCATCAAG TCGAACATAT GAAAAATGCA TATCAACAAA AAGGTATTGT 18 0 

GTTTTTAATG ATT CGTTTTA AAACGCTAGA TGAAGTTTAT CTTTTACCCT ATTCAAAATT 24 0 

CGAAGTATTT TGGAAGAGAT ATAAAGATAA TATTAAAAAG TCTATAACAG TTGATGAAAT 300 

ACGAAAAAAT GGTTACCATA TTCCTTATCA GTATCAACCA AGATTAGACT ATCTAAAAGC 36 0 

AGTTGATAAG TTGATATTAG ATGAAAGTGA GGACCGCGTA TGACGGAAAA CAAAGGATCT 4 20 

TCTCAGCCTA AGAAAAACGG TAATAATGGT GGGAAATCCA ACTCAAAAAA GAATAGAAAT 48 0 

GTGAAGAGAA CGATTATTAA GATTATTGGC TTCATGATTA TTG CATTTTT CGTTGTTCTT 54 0 

TTACTAGGTA TCTTATTGTT TGCTTATTAT GCTTGGAAAG CACCTGCTTT TACCGAAGCT 60 0 
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TTAGATAATG GCCAAAGACA TGAGCATGTA AATTTAAAAG ACGTGCCGAA ATCAATGAAA 72 0 

GACGCAGTAC TTGCAACTGA AGACAATCGT TTCTACGAAC ATGGCGCACT TGATTATAAA 780 

CGTTTATTCG GTGCAATTGG TAAGAACTTG ACTGGTGGAT TTGGkTCtGA AGGtGCCTCA 84 0 

ACATTAACAC AA 852 
(2) INFORMATION FOR SEQ ID NO: 249: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5804 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 249: 

CACTTTTTTC ATTAAAAATC TCATATTTAT ACACTGAACG TAATCTCGAA TATTTTTCAA 6 0 

CCCAAGTTTT AACTTTAACT TTTTCTGGAT AAAAAATAGA CTTTTTATAA TTGACATTGA 12 0 

GGTCAGTCAC AGGTGAAATG ATTCCTTGTT TTTCCATATC AGCATAACTA AAACCTAACT 180 

TCGATATATA ATCCAACCGC GCAACTTCAA ACCAAGTTGC ATAATTCCCG TGATAAATTA 24 0 

CACCCATCTT ATCAGTTTCA GCATAACGCG CTTCTATTTC TGTAATACTA TATATCATTT 300 

TAAGCCTTCT TTCAGTTTAA CTTTATATCT CATTCTAACA TAAAATACAA GAAGAGGCCG 360 

GCCAAGAACA CAAAGGkTTT GAACCGACCT ATTATATCAT AAaGTTTATA GAAGTATTTT 4 20 

TGAGCACTAT CAAAGTGCCT CAAATACCGA TTAAAATTTT ACTGTGATAT CTATTTTTTA 4 80 

TTGCG CTAAT TTATTTCTTA AAACCATTTG TAAAATT CCA CCGTGACGAT AGTAATCCAT 54 0 

TTCAACAAGT GAGTCAAAAC GAACCATAGC GTCAAATTCT ACCAAATCAC CATCTTGCTT 6 00 

CTTAGCAGTA ACTTTGACGT AGtCATGTGG TTGAACATTT TCATCAATAT TAACAGrAAT 6 60 

TTCTTCTGTA CCATCTAGAC CAAGAGAATC AGCTGATTCA CCTTTTTTAA ACTCTAATGG 720 

TAATACACCC ATCATAACTA AATTTGAACG ATGGATACGT TCATAACTTT GTG CAATAAC 780 

TGTTTTAACA CCTAATAAGT TTGTACCTTT TGCTGCC CAG TCACGAGATG AACCCATACC 840 

ATAATCGTTA CCAGCTAATA CAACTAAACC TGTACCATCT TCTTTATATT TCATTGCAGC 900 

ATCAAAGATA GGCATTACTT CATTTGTTGG CCAATAAGTT GTAAAAC CAC CTTCAGTACC 960 

TGGCGCTAAT TGGTTTTTAA TACGTATATT AGCAAACGTA CCTCGAACCA TTACTTCGTG 1020 

ATTACCACGT CTTGAAC CAT ATGAATTAAA TTCACGAATA GGCACTTGAT GATCTTGTAA 10 8 0 

ATATTTAC C A GCTGGCGTAT CTTTAC CAAT TGCACCTGCT GGAGAGATGT GGTCAGTTGT 114 0 
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